"ChatGPT gör dig dum", "AI skadar hjärnan", "MIT-studie: artificiell intelligens orsakar kognitiv försämring". Under de senaste månaderna har sådana alarmistiska rubriker dominerat allmänna medier och underblåst ogrundade farhågor om användningen av artificiell intelligens inom utbildning och arbete. Men vad säger vetenskapen egentligen? En kritisk analys av litteraturen avslöjar en mycket mer komplex och, framför allt, mer optimistisk verklighet.
MIT Media Labs studie "Your Brain on ChatGPT" har utlöst en våg av alarmistisk mediebevakning, ofta baserad på felaktiga tolkningar av resultaten. Studien, som publicerades som preprint (dvs. utan peer review), omfattade endast 54 deltagare från Boston-området, varav endast 18 fullföljde den avgörande sessionen.
Otillräckligt urval: Med totalt 54 deltagare saknar studien den statistiska styrka som krävs för att dra generaliserbara slutsatser. Som forskarna själva medger är urvalet ”litet” och ”homogent: personer i närheten av MIT speglar inte nödvändigtvis fördelningen av människor i världen”.
Problematisk experimentell design: Deltagarna skulle skriva SAT-uppsatser på bara 20 minuter – en artificiell begränsning som naturligtvis leder till kopiering och klistring istället för reflekterande integration. Denna design ”imiterar väl de naturliga begränsningarna i verkliga livet”, såsom ”deadline är imorgon” eller ”jag skulle hellre spela videospel”, men representerar inte en pedagogiskt informerad användning av AI.
Förvirrande effekten av förtrogenhet: Gruppen som endast använde hjärnan visade gradvisa förbättringar under de tre första sessionerna, helt enkelt genom att bli mer förtrogen med uppgiften. När AI-gruppen skulle skriva utan hjälp under den fjärde sessionen, var det första gången de utförde uppgiften utan att ha övat.
Medan media fokuserade på MIT:s alarmerande resultat, gav en mycket mer rigorös forskning radikalt olika resultat.
En studie genomförd vid Kwame Nkrumah University of Science and Technology följde 125 universitetsstudenter i en randomiserad kontrollerad studie under ett helt semester. Resultaten motsäger direkt MIT:s slutsatser:
Kritiskt tänkande: Eleverna som använde ChatGPT förbättrade sig från 28,4 till 39,2 poäng (+38 %) och överträffade därmed kontrollgruppen (från 24,9 till 30,6, +23 %) avsevärt.
Kreativt tänkande: Ännu mer dramatiska ökningar, från 57,2 till 92,0 poäng (+61 %) för ChatGPT-gruppen, med förbättringar inom alla sex mätta dimensioner: mod, innovativ forskning, nyfikenhet, självdisciplin, tvivel och flexibilitet.
Reflekterande tänkande: Betydande förbättringar från 35,1 till 56,6 poäng (+61 %), vilket indikerar en ökad förmåga till självreflektion och metakognition.
Viktiga metodologiska skillnader: Studien i Ghana använde validerade skalor (Cronbach α > 0,89), bekräftande faktoranalys, ANCOVA-kontroller för pretest-poäng och – vilket är avgörande – integrerade ChatGPT i en verklig utbildningskontext med lämplig pedagogisk scaffolding.
Den mest rigorösa studien som finns tillgänglig involverade 758 konsulter från Boston Consulting Group i ett förhandsregistrerat och kontrollerat experiment. Resultaten var entydiga:
Som Ethan Mollick, medförfattare till studien, påpekar: "De rådgivare som använde ChatGPT presterade betydligt bättre än de som inte gjorde det. På alla områden. Oavsett hur vi mätte prestationen."
En systematisk genomgång av forskningen om AI inom högre utbildning har identifierat betydande fördelar:
En multinationell studie av 401 kinesiska universitetsstudenter med hjälp av strukturella ekvationsmodeller bekräftade att ”både AI och sociala medier har en positiv inverkan på akademiska prestationer och mentalt välbefinnande”.
Medias rapportering om MIT-studien är ett typiskt exempel på hur sensationsjournalistik kan förvränga allmänhetens förståelse av vetenskap.
Typisk rubrik: "MIT-studie visar att ChatGPT gör människor dumma"
Verkligheten: Preliminär, icke-granskad studie med 54 deltagare finner skillnader i neural konnektivitet vid artificiella uppgifter.
Typisk rubrik: "AI skadar hjärnan"
Verkligheten: EEG visar olika aktiveringsmönster som kan tolkas som neural effektivitet snarare än skada.
Typisk rubrik: "ChatGPT orsakar kognitiv försämring"
Verkligheten: En studie med allvarliga metodologiska begränsningar som motsägs av mer rigorösa undersökningar.
MIT:s huvudforskare Nataliya Kosmyna har erkänt att hon infogade ”fällor” i artikeln för att förhindra LLM från att sammanfatta den korrekt. Ironiskt nog använde många användare på sociala medier sedan just LLM för att sammanfatta och dela studien, vilket oavsiktligt visade på dessa verktygs praktiska användbarhet.
Seriös forskning om AI inom utbildning förnekar inte att det finns utmaningar, men sätter dem i ett mer sofistikerat sammanhang. Begreppet ”tandad teknisk gräns” i Harvard-studien illustrerar att AI är utmärkt för vissa uppgifter, medan det kan vara problematiskt för andra, till synes liknande uppgifter.
Tidpunkt för införande: Bevis tyder på att man kan maximera fördelarna genom att utveckla grundläggande färdigheter innan man inför AI. Som MIT-studien själv påpekar uppvisade deltagarna i ”Brain-to-LLM” bättre minnesåterkallelse och aktivering av occipito-parietala och prefrontala områden.
Pedagogisk design: Studien från Ghana visar vikten av att integrera AI med lämplig pedagogisk scaffolding, väl utformade uppmaningar och tydliga inlärningsmål.
Betydande sammanhang: Användningen av AI i verkliga utbildningssammanhang, snarare än i artificiella uppgifter, ger dramatiskt olika resultat.

Den snedvridna mediebevakningen är inte bara ett akademiskt problem – den har reella konsekvenser för införandet av potentiellt fördelaktiga tekniker.
Som Kosmyna själv medger: "Det som motiverade mig att publicera det nu, innan en fullständig kollegial granskning har genomförts, är att jag är rädd att det om 6–8 månader kommer att finnas någon politisk beslutsfattare som beslutar att 'vi ska införa GPT-förskola'. Jag tror att det skulle vara helt negativt och skadligt."
Detta uttalande avslöjar en advokatmotivation som borde väcka misstankar om forskningens vetenskapliga neutralitet.
En undersökning med 28 698 mjukvaruingenjörer visade att endast 41 % hade provat AI-verktyg, med ännu lägre användning bland kvinnor (31 %) och ingenjörer över 40 år (39 %). Alarmistiska rubriker bidrar till dessa fördomar och berövar potentiellt många arbetstagare de bevisade fördelarna med AI.
AI-företag måste balansera entusiasmen för tekniken med ärlig kommunikation om dess begränsningar. Resultaten av seriös forskning tyder på verkliga fördelar när AI implementeras på ett genomtänkt sätt, men också på behovet av:
Istället för att reagera defensivt på negativa rubriker bör AI-branschen:
Historien om MIT-studien och dess mediebevakning ger viktiga lärdomar för alla intressenter i AI-ekosystemet.
Pressen att publicera "nyhetsvärdiga" resultat får inte äventyra den metodologiska stringensen. Preprints kan vara användbara för den vetenskapliga debatten, men kräver noggrann kommunikation om sina begränsningar.
Allmänheten förtjänar noggrann rapportering som skiljer mellan:
Framtiden för AI inom utbildning beror på genomtänkta implementeringar baserade på gedigna bevis, inte på reaktioner på de senaste sensationella rubrikerna.
Medan debatten rasar i tidningsrubrikerna, visar seriös forskning på AI:s verkliga potential att demokratisera tillgången till högkvalitativa lärandeupplevelser. Studien från Ghana visar att AI, när den implementeras på rätt sätt, kan:
Frågan är inte om AI kommer att förändra utbildningen, utan hur vi kan styra denna förändring på ett ansvarsfullt sätt. Svaret ligger i rigorös vetenskap, inte i sensationella rubriker.
Källor och referenser:
För att hålla dig uppdaterad om seriös vetenskaplig forskning om AI (utan sensationsmakeri), följ vår företagsblogg och prenumerera på vårt newsletter.