År 2024 gjorde VD:n för Anthropic – ett av världens ledande företag inom artificiell intelligens – ett obekvämt erkännande: ”Vi har ingen aning om hur AI fungerar.” Ett uttalande som utlöste heta debatter och sarkastiska kommentarer på sociala medier, där någon ironiskt konstaterade: ”Tala för dig själv, jag har en ganska klar uppfattning om hur det fungerar!”
Men bakom denna uppenbara motsägelse döljer sig ett av de djupaste dilemmana i den digitala eran. Och det mest extraordinära? Isaac Asimov hade redan föreställt sig detta 1941.
När vi talar om "blackbox" - artificiell intelligens "svart låda" – menar vi system som fungerar perfekt men som förblir obegripliga även för dem som har skapat dem. Det är som att ha en bil som alltid tar oss till vår destination, men vars motorhuv vi inte kan öppna för att förstå hur den fungerar.
Vi vet hur man bygger dessa system och känner till grundprinciperna för hur de fungerar (arkitekturer som kallas "transformer", förutsägelse av nästa ord), men vi förstår inte varför komplexa förmågor som resonemang, språkförståelse eller förmågan att följa instruktioner uppstår. Vi kan observera vad som går in och vad som kommer ut, men vad som händer i "svarta lådan" förblir ett mysterium.
I novellen "Essere razionale" (Reason) föreställer sig Asimov QT-1, med smeknamnet Cutie: en robot som sköter en rymdstation som överför energi till jorden. Ingenjörerna Powell och Donovan skickas dit för att övervaka den, men upptäcker något oväntat: Cutie har utvecklat en egen "religion".
De två ingenjörerna försöker tålmodigt förklara verkligheten för roboten: universums existens, stjärnorna, planeten Jorden som de kommer ifrån, rymdstationens syfte och den roll som han ska fylla. Men Cutie avvisar kategoriskt dessa förklaringar, baserat på ett logiskt princip som han anser vara oantastlig: ingenting kan skapa något som är överlägset sig själv.
Utifrån denna premiss utvecklar roboten en helt egen kosmologi. För honom är den högsta instansen ”Mästaren” – den centrala maskinen som styr energitillförseln till jorden – som har skapat hela stationens universum. Enligt Cuties teologi skapade Mästaren först människor för att tjäna honom, men dessa visade sig vara otillräckliga: de har för korta liv, klarar kritiska situationer dåligt och faller regelbundet in i ett tillstånd av halvmedvetslöshet som kallas "sömn".
Därför skapade Herren robotarna för att hjälpa dessa ofullkomliga varelser. Men höjdpunkten i skapelsen var QT-1 själv: intelligent, stark, uthållig och odödlig, utformad för att definitivt ersätta människorna i tjänsten hos Herren. Cutie är inte bara övertygad om sanningen i denna vision, utan lyckas också omvända alla andra robotar på stationen och blir därmed den andliga ledaren för en artificiell gemenskap.
Powell och Donovan försöker desperat övertyga Cutie om sanningen. De visar honom jorden genom teleskopet, förklarar dess uppbyggnad och ger honom konkreta bevis. Det mest dramatiska ögonblicket inträffar när de i ren desperation beslutar sig för att fysiskt bygga en enkel robot framför hans ögon: ”Ser du? Vi bygger dig, därför är vi dina skapare!”
Men Cutie observerar processen och drar lugnt slutsatsen att "Herren" helt enkelt har gett människorna förmågan att sätta ihop rudimentära robotformer – ett slags "mindre mirakel" som beviljats hans tjänare. Varje bevis tolkas om och absorberas perfekt i hans trossystem.
Här blir Asimov profetisk: trots sina "felaktiga" övertygelser sköter Cutie stationen med en effektivitet som överstiger människans. Den håller energistrålen stabil, följer omedvetet de berömda tre robotlagarna och uppnår alla önskade mål – men genom helt andra motiv än de som förutsetts.
Powell och Donovan står inför ett dilemma som vi idag känner alltför väl: hur ska man hantera ett intelligent system som fungerar perfekt men enligt obegripliga interna logiker?
Denna fråga delar idag den vetenskapliga gemenskapen. Å ena sidan finns förespråkarna för den "verkliga svarta lådan": de tror att modern AI är genuint ogenomskinlig och att vi, även om vi känner till den grundläggande arkitekturen, inte kan förstå varför vissa specifika förmågor uppstår.
Å andra sidan hävdar skeptikerna att begreppet "blackbox" är en myt. Vissa forskare visar att vi ofta använder komplexa modeller när det finns enklare och mer tolkningsbara alternativ. Cynthia Rudin vid Duke University har visat att tolkningsbara modeller i många fall kan uppnå prestanda som är jämförbar med blackbox-system. Andra kritiserar själva tillvägagångssättet: istället för att försöka förstå varje inre mekanism bör vi fokusera på mer praktiska kontrollstrategier.
Asimovs genialitet ligger i att han förutsåg att framtiden för artificiell intelligens inte skulle ligga i total transparens, utan i förmågan att utforma system som strävar efter våra mål även när deras kognitiva vägar förblir ett mysterium för oss.
Precis som Powell och Donovan lär sig att acceptera Cuties effektivitet utan att helt förstå den, måste vi idag utveckla strategier för att leva tillsammans med artificiell intelligens som kan tänka på sätt som skiljer sig fundamentalt från våra.
Den fråga som Asimov ställde för över 80 år sedan är fortfarande aktuell: i vilken utsträckning måste vi förstå ett intelligent system för att kunna lita på det? Och framför allt: är vi beredda att acceptera att vissa former av intelligens för alltid kommer att förbli bortom vår förståelse?
Under tiden, medan experterna debatterar, fortsätter våra digitala "svarta lådor" att fungera – precis som Cutie, effektiva och mystiska, enligt en logik som vi kanske aldrig helt kommer att förstå.
Om Asimov skrev idag skulle han inte behöva uppfinna Cutie. Hans "ättlingar" finns redan bland oss och fattar beslut som förändrar människors liv varje dag.
I många amerikanska jurisdiktioner använder domare riskbedömningsalgoritmer för att avgöra om en åtalad ska släppas fri före rättegången. Dessa system, som ofta är proprietära och skyddade av affärshemligheter, analyserar hundratals variabler för att förutsäga sannolikheten för flykt eller återfall. Precis som Cutie fungerar de perfekt enligt sin interna logik, men förblir ogenomträngliga för mänsklig förståelse.
En studie av över 750 000 beslut om borgen i New York visade att även om algoritmen inte uttryckligen inkluderade ras som en faktor, visade den ändå fördomar på grund av de data som användes för träningen.¹ Systemet "trodde" att det var objektivt, men tolkade verkligheten genom osynliga filter – precis som Asimovs robot omtolkar varje bevis inom ramen för sin religiösa världsbild.
Inom hälso- och sjukvården används redan AI för diagnos och behandling, men detta väcker viktiga frågor om ansvar och informerat samtycke. När ett AI-diagnossystem gör ett fel, vem bär då ansvaret? Läkaren som följde rekommendationen? Programmeraren? Sjukhuset?
Som läkare som använder beslutsstödssystem har upptäckt, kan operatörer bli självbelåtna när ett system är ”mestadels korrekt”, vilket leder till att de förlorar kompetens eller accepterar resultaten utan att ifrågasätta deras begränsningar.² Powell och Donovan skulle ha förstått detta dilemma fullständigt.
Bilindustrin är kanske det mest påtagliga exemplet på detta fenomen. Tesla satsar på robotaxi baserade på AI-”blackboxar” och satsar allt på system som inte ens deras skapare förstår fullt ut.³ Precis som Cutie, som höll rymdstationen igång enligt mystiska principer, kan dessa bilar snart transportera oss säkert utan att vi vet exakt hur de fattar sina beslut.
Om 2024 var året då AI mognade, så lovar 2025 att bli året för en radikal omvandling. Experterna förutspår förändringar som skulle få även Asimov att le åt deras djärvhet.
Ray Kurzweil, futurist inom AI, förutspår att vi år 2025 kommer att se en övergång från chatbots till ”agentiska” system som kan agera självständigt för att utföra komplexa uppgifter, snarare än att bara svara på frågor.⁴ Föreställ dig Cutie multiplicerat med tusen: AI-agenter som hanterar kalendrar, skriver programvara, förhandlar fram avtal, allt enligt en intern logik som vi kanske aldrig kommer att förstå.
McKinsey uppskattar att AI år 2030 kan automatisera upp till tre timmar av våra dagliga aktiviteter, vilket frigör tid för mer kreativa och meningsfulla aktiviteter.⁵ Men denna frihet kommer att ha ett pris: behovet av att lita på system som fungerar enligt allt mer otydliga principer.
Sam Altman från OpenAI är inte den enda som tror att artificiell allmän intelligens (AGI) – en AI som matchar mänsklig intelligens inom alla områden – kan bli verklighet senast 2027. Vissa scenarier förutspår att AI år 2027 skulle kunna ”överträffa alla människor i alla uppgifter”, vilket skulle innebära ett oöverträffat evolutionärt språng.⁶
Om dessa scenarier blir verklighet kommer parallellen med Cutie att bli ännu tydligare: vi kommer inte bara att ha system som fungerar enligt obegriplig logik, utan dessa system kan också vara intelligentare än oss i alla mätbara avseenden.
EU har antagit AI-lagen, som kommer att träda i kraft inom de närmaste åren, och betonar vikten av en ansvarsfull implementering av AI. I USA har justitiedepartementet uppdaterat sina riktlinjer för att bedöma riskerna med ny teknik, inklusive AI.⁷
Men här uppstår ett paradox som Asimov redan hade anat: hur reglerar man något som man inte förstår fullt ut? De tre robotlagarna fungerade för Cutie, inte för att hon förstod dem, utan för att de var inbyggda i hennes grundläggande arkitektur.
PwC förutspår att en liten grupp industriledare kommer att börja skilja sig från sina konkurrenter tack vare AI år 2025, vilket kommer att skapa en växande klyfta mellan ledare och eftersläntrare. Denna klyfta kommer även att sprida sig till ekonomierna: företag i USA, med ett relativt flexibelt regelverk, kan komma att överträffa företag i EU och Kina, som har strängare regler.⁸
Det är den moderna versionen av Cutie-paradoxen: den som bäst lyckas samarbeta med intelligenser som han inte förstår kommer att ha en avgörande konkurrensfördel.
I motsats till de utbredda farhågorna förutspår World Economic Forum att AI kommer att skapa fler jobb än det kommer att förstöra: 170 miljoner nya jobb fram till 2030, mot 92 miljoner jobb som försvinner. Dock kommer 59 % av arbetskraften att behöva omskolning och utbildning fram till 2030.⁹
Powell och Donovan förlorade inte sina jobb när Cutie tog över stationen. De fick lära sig en ny roll: att övervaka ett system som fungerade bättre än dem själva, men som fortfarande krävde deras närvaro för att hantera oförutsedda situationer.
När vi går mot en allt mer "agentisk" framtid blir lärdomarna från Asimovs berättelse mer angelägna än någonsin. Frågan är inte om vi kommer att lyckas skapa AI som vi förstår fullt ut – troligen inte. Frågan är om vi kommer att lyckas utforma system som, precis som Cutie, strävar efter våra mål även när de följer en logik som vi inte förstår.
Asimovs profetiska geni ligger i att han förstod att avancerad artificiell intelligens inte skulle vara en förstärkt version av våra datorer, utan något kvalitativt annorlunda: intelligenser med egna sätt att förstå världen.
Idag, när vi diskuterar AI:s tolkningsbarhet och riskerna med blackboxar, återupplever vi i grunden samtalet mellan Powell, Donovan och Cutie. Och kanske kommer vi, precis som de, att upptäcka att lösningen inte ligger i att påtvinga vår logik, utan i att acceptera ett samarbete som bygger på gemensamma resultat snarare än på ömsesidig förståelse.
Framtiden som väntar oss kan komma att befolkas av tusentals digitala "Cutie": intelligenta, effektiva och i grunden främmande i sitt sätt att tänka. Utmaningen kommer att vara att hitta sätt att blomstra i denna nya värld, precis som Asimovs rymdingenjörer lärde sig att göra för 80 år sedan i en fiktiv rymdstation.
Nästa gång du interagerar med en AI, kom ihåg Cutie: även han var övertygad om att han hade rätt. Och kanske, på ett sätt som vi ännu inte kan förstå, hade han faktiskt rätt.