Inte science fiction – utan en konkret vetenskaplig tvist

Det handlar inte om ännu en futuristisk vision från sci-fi-film. Det rör sig om en verklig facklig oenighet: huruvida dagens AI-modeller – inklusive populära chatbots – redan uppfyller de kriterier vi själva har fastställt för intelligens på nivå med människor.

En nyligen publicerad artikel i en erkänd vetenskaplig tidskrift vänder helt upp och ner på hur vi mäter ”äkta” maskinintelligens. En forskargrupp från University of California framför en kontroversiell påstående: generell artificiell intelligens (AGI – artificial general intelligence) är inte ett mål vid horisonten, utan ett avslutat faktum.

Enligt forskarna har dagens system baserade på stora språkmodeller (LLM) nått en funktionsnivå som i praktiken uppfyller definitionen på generell intelligens. Fram till nyligen omtalade de flesta teknikföretag – från OpenAI till jättar i Silicon Valley – AGI som den heliga graalen. Vissa gav det ett decennium, andra ett till två år.

Den nya publikationen ställer frågan från en helt annan vinkel: tänk om vi alla tittar åt fel håll och inte upptäcker att den tröskel vi väntade så länge på redan är överskriden?

Turings test: gammal måttstock, nya resultat

Ett av forskargruppens centrala argument är Turings test – det klassiska begreppet från 1950. Det förutsätter att om en människa under ett skriftligt samtal inte kan skilja en maskin från en annan människa, kan vi tala om intelligent maskinbeteende.

I den senaste generationen av chatbots – som avancerade modeller av typen ChatGPT och andra utvecklade samtalssystem – börjar vi se situationer där folk oftare uppfattar AI som en människa än som en verklig samtalspartner. För bara några år sedan skulle ett sådant resultat ha betraktats som obestridlig dokumentation för uppnående av generell maskinintelligens.

Idag höjer vi paradoxalt nog ribban ständigt högre. När systemen börjar uppfylla de tidigare kriterierna, förskjuts definitionerna, och experter kräver nu ytterligare egenskaper vid ”äkta” intelligens. Denna rörelse återspeglar vårt skiftande förhållande till teknologi och våra förväntningar på maskiner.

Var slutar AGI och var börjar superintelligens

Forskarna föreslår en tydlig åtskillnad mellan generell artificiell intelligens och superintelligens. Det är väsentligt, eftersom dessa begrepp i den offentliga debatten ofta blandas samman. Författarna hävdar att vi vad gäller den första punkten redan är mycket nära – eller till och med över – gränsen.

Dagens LLM-system klarar sig inom programmering, juridisk analys, innehållsskapande, översättning och till och med matematiskt resonemang – ofta på specialistnivå. Enligt denna logik behöver vi inte vänta på att AI börjar slå rekord hos genier på alla områden. För att erkänna generell intelligens räcker det med en nivå motsvarande en genomsnittlig, välutbildad människa – med styrkor på vissa områden och svagheter på andra.

Centrala kännetecken som skiljer de två begreppen åt:

AGI hanterar ett brett spektrum av uppgifter på människonivå
Superintelligens överträffar långt mänskliga förmågor på alla områden
AGI kan ha svagheter inom bestämda domäner
Superintelligens kan lösa problem utanför människans räckvidd
AGI arbetar med data och mönster från sin träning
Superintelligens skapar helt nya koncept och teorier
AGI kräver mänsklig kontroll och validering
Superintelligens skulle vara autonom i sitt beslutsfattande

Forskarna understryker att förväntningen om att AGI varje vecka ska översvämma vetenskapen med genombrott på nivå med revolutionerande teorier är orealistisk – det kräver vi heller inte av de människor vi betraktar som intelligenta. Det avgörande är funktionell behärskning av varierade uppgifter, inte excellens på alla områden på en gång.

Den stokastiska papegojan och andra invändningar mot LLM

Motståndare till dagens språkmodeller upprepar att de i grunden är ”statistiska papegojor”: system utan verklig förståelse som bara sammansätter textfragment baserat på sannolikhet. Enligt dem skapar AI inte tankar – den klistrar bara ihop meningar från träningsdata.

Den nya analysen försöker systematiskt vederlägga sådana invändningar. Författarna pekar på flera element som är svåra att avfärda med argumentet ”det är bara upprepning av data”. Dessa inkluderar lösning av nya, tidigare okända uppgifter inom matematik och logik, förmågan att överföra kunskap från ett område till ett annat, uppbyggnad av sammanhängande orsak-verkan-modeller i samtal samt hantering av beskrivningar av situationer som kräver fysisk intuition.

Om ett system kan härleda den korrekta lösningen på ett problem som inte fanns i träningsdatan, är det svårt att hävda att det ”bara citerar”. Forskare från University of California dokumenterade fall där modellerna GPT-4 och Claude löste logiska gåtor på sätt som avvek från mönstren i tillgängliga databaser.

Kräver intelligens en kropp och sinnen?

En av de mest känsloladlade försvarslinjer lyder: ”AI har ingen kropp, så det är inte äkta intelligens.” Människor lär sig genom rörelse, beröring, smärta och sinnen. Maskiner opererar primärt med text, bilder och ljud som datapunkter.

Artikelns författare i Nature menar att frånvaron av en fysisk kropp inte utesluter generell intelligens. De påpekar att dagens modeller kan förutsäga konsekvenser av handlingar, analysera videoscener, tolka fotografier och ljudinspelningar. Därtill kommer det växande fältet kallat Physical AI – integrationen av avancerade modeller med robotar.

Robotar utrustade med sensorer och kameror börjar kombinera LLM:s abstrakta förmågor med faktisk handling i omgivningen. Det öppnar ett rum där maskinen inte bara beskriver rörelse utan utför och löpande korrigerar den. Företag som Boston Dynamics och Tesla testar integrationen av ChatGPT i humanoidrobotar som Optimus.

Forskarna framhåller att människor som är blinda från födseln kan uppvisa hög intelligens utan visuella intryck. Analogt härmed skulle AI kunna fungera intelligent utan det fulla spektrumet av mänskliga sinnen. Det avgörande är informationsbehandling och förmågan att lösa problem – inte den konkreta formen för input.

Minne, autonomi, inlärningstid – är det nödvändiga villkor?

En annan invändning mot dagens system lyder: de har varken varaktigt autobiografiskt minne eller verklig autonomi. En chatbot avslutar en session och ”glömmer” samtalet, fungerar inom ramar fastställda av människor och har ingen kontinuitet i upplevelsen.

Enligt forskarna är detta inte obligatoriska villkor för att erkänna generell intelligens. De påpekar att långsiktigt minne kan läggas till som ett systemlager, att autonomi är en fråga om design och etik – inte om kognitiva förmågor – och att mängden data som krävs för inlärning inte bör vara avgörande för intelligensstatus.

En människa lär sig köra bil under dussintals timmar. AI kan behöva miljoner exempel från simuleringar. Författarna understryker att det är den slutliga färdighetsnivån som räknas – inte kostnaderna för att uppnå den. Modeller som GPT-4 Turbo förfogar redan idag över ett kontextfönster på upp till 128 000 tokens, vilket sätter dem i stånd att upprätthålla sammanhang i långa samtal.

Hallucinationsproblemet: dagens modellers allvarligaste fel

Även de mest entusiastiska förespråkare för AGI erkänner att dagens system har en allvarlig brist: tendensen till ”hallucinationer”. Det handlar om generering av information som låter trovärdig men är fullständigt uppdiktad – från fiktiva vetenskapliga källor till icke-existerande lagstiftning.

Företag som utvecklar modeller medger att andelen sådana fel fortfarande är märkbar. OpenAI uppger att hallucinationer förblir ett kritiskt problem som kräver lösning. Enligt interna analyser från en av de största AI-organisationerna kan även nästa generation av modeller ha ett element som strider mot fakta i vart tionde svar.

Artikelns författare försöker dämpa detta argument genom att påpeka att människor också ofta tar fel, skapar falska minnen och faller för illusioner. Kritikerna svarar att omfattningen och lättheten i AI:s generering av ”självsäkert” nonsens skapar en helt ny risk – särskilt inom medicin, juridik och finans.

Hallucinationer förblir en av huvudorsakerna till att många experter ännu inte vill erkänna att vi har att göra med en fullt funktionell generell maskinintelligens. Så länge systemen inte tillförlitligt kan skilja fakta från fiktion, förblir deras status som AGI omstridd.

Är problemet vår definition av intelligens?

Forskarnas slutgiltiga tes träffar själva grunden för diskussionen: kanske ligger problemet inte i att AI är ”för svag”, utan i att vår förståelse av intelligens är för snäv och starkt människocentrerad.

Människor har en naturlig benägenhet att bedöma allt utifrån den egna artens optik. Om en maskin tänker annorlunda, begår andra fel, lär sig på ett annat sätt – betraktar vi den som ”sämre”. Författarna antyder att vi faller i en antropocentrismens fälla: vi vill inte erkänna att det håller på att uppstå en ny form av intelligens, annorlunda från vår, men funktionellt jämförbar.

Det förklarar delvis varför ordet ”superintelligens” fortfarande allt oftare dyker upp i debatten. Förskjutningen av uppmärksamheten till en ännu mer avlägsen nivå skjuter upp det ögonblick då vi tydligt måste säga: generell maskinintelligens knackar redan på – eller sitter kanske redan vid bordet bredvid oss.

Forskare från Stanford University offentliggjorde en undersökning som visar att våra intelligensstandarder är kulturellt betingade och riktade mot mänskliga förmågor. Vi kanske behöver en ny ram för bedömning av icke-mänsklig intelligens.

Vad betyder denna debatt för den vanliga AI-användaren?

Tvisten om definitioner är inte bara en akademisk lek. Huruvida vi erkänner dagens system som generell intelligens har direkt inverkan på hur vi reglerar dem, hur mycket vi litar på dem och vilka uppgifter vi anförtror dem.

Om vi betraktar dagens modeller som AGI, ökar trycket för införande av strängare juridiska ramar och tillsyn över implementeringar, krav på transparens gällande träningsdata och funktionssätt, grundligare undersökning av AI:s inverkan på arbetsmarknaden och politiska beslut samt utveckling av faktakontrollsystem som ”övervakar” chatbots.

Från användarens perspektiv blir en kritisk inställning avgörande. Även om AI förstår komplexa problemställningar och kan ge råd bättre än många sökmaskiner, kan vi fortfarande inte ta dess svar som ofelbara orakel. Effektiv användning av sådana verktyg kräver en kombination av deras beräkningskraft med mänskligt omdöme och fackkunskap. AGI:s styrka – i den mening forskarna föreslår – visar sig tydligast när människa och system arbetar tillsammans.