Strümke om AI-sjokket: – Mindre eksklusivt enn vi trodde

3 months ago 18


AI-forsker Inga Strümke er ikke like imponert som resten av verden.

Inga Strümke er førsteamanuensis ved Institutt for datateknologi og informatikk ved NTNU. Foto: Skjalg Bøhmer Vold

Publisert: Publisert:

Nå nettopp

Det kinesiske selskapet Deepseek sendte sjokkbølger gjennom aksjemarkedene bare dager etter selskapet lanserte en ny språkmodell. AI-kjempen Nvidia opplevde det største verdifallet i løpet av New York-børsens historie.

Både Silicon Valley-legende Marc Andreessen og E24s egen kommentator kalte det et «Sputnik-øyeblikkSputnik-øyeblikkEt Sputnik moment er en plutselig erkjennelse av å ligge bak en konkurrent, som utløser en intens satsing på innovasjon, inspirert av Sovjetunionens oppskyting av Sputnik 1 i 1957.». Så stort er det ikke, mener den anerkjente AI-forskeren ved NTNU.

– Noen har sagt at dette er et Sputnik-øyeblikk, det er det ikke. Kineserne klarer ikke løse problemer som USA ikke kan løse, men de har klart å lage et mer imponerende stykke språkteknologi, sier Inga Strümke.

Strümke var heller ikke like overrasket over AI-nyheten som markedene. Hun har bare ventet på at noen skulle utvikle en mindre ressurskrevende språkmodell, slik Deepseek R1 er.

– Denne utviklingen er å forvente. Hjernen behersker språk vel så godt som språkmodellene, og hjernen bruker like mye energi som en glødelampe, sier hun.

At markedene reagerte så sterkt, handlet mer om en sterk tro på USAs dominans og hvordan utviklingen kom til å gå, mener hun.

Utfordrer USAs monopol

Deepseek R1 er en ny AI-modell som kan utføre avanserte språkoppgaver med en brøkdel av regnekraften som konkurrentene krever. Det utfordrer dagens AI-utvikling, der stadig større og mer ressurskrevende modeller har dominert.

– Utviklingen av generativ AI i USA har vært preget av å stadig bruke mer regnekraft for å bygge større og mer komplekse modeller. Det har krevet enorme investeringer i hardware. Mange forskere har vært uenig i denne fremgangsmåten, sier hun.

AI-forskere har lenge tatt til orde for å utvikle mindre og mer elegante systemer, forklarer Strümke. Men AI-kappløpet som USA har vært opptatt av å vinne, har kommet i veien for det.

Å utvikle mindre ressurskrevende språkmodeller går nemlig ikke like raskt.

Strümke håper at Deepseek-utviklingen vil bidra til økt forskningsinnsats på mindre energikrevende AI-systemer.

– Langt flere vil nå kunne utvikle egne språkmodeller. Det som så ut til å bli et monopol for selskaper med enorme serverparker og dype lommer, viser seg å være mindre eksklusivt enn vi trodde.

Forventer noe billigere og bedre

Til tross for Deepseeks fremskritt, er det er ingen grunn til å tro at dette er det beste man kan få til, forklarer Strumke.

– Jeg forventer at noen skal klare å gjøre det billigere og bedre innen noen få måneder, sier hun.

For utviklingen går fort. Allerede onsdag lanserte det kinesiske teknologiselskapet Alibaba en språkmodell som de hevder er bedre enn Deepseek første modell, V3.

Read Entire Article