Javascript är avstängt

Javascript måste vara påslaget för att kunna spela video
Hör forskaren Ariel Ekgren berätta om den nya svenska språk-AI:n. Foto: AI Sweden

Svensk språk-AI under utveckling – har tränats på bland annat 1177 och Flashback

Uppdaterad
Publicerad

GPT-SW3 är den första storskaliga generativa språkmodellen som utvecklats för svenska språket. Den har tränats på stora delar av det svenskspråkiga internet, både på vetenskapliga källor och kontroversiella chatforum. 

– Den kan fungera som alltifrån skrivstöd till att klassificera texter och hjälpa till med programmering, säger Ariel Ekgren, forskare på AI Sweden, ett nationellt centrum för tillämpad AI som är både privat och offentligt finansierat.  

Modellen har tagits fram i ett forskningsprojekt och har tränats på svenska internet med källor som till exempel det digitala vetenskapliga arkivet Diva, 1177, läkemedelsdatabasen FASS och Litteraturbanken. Men också på öppna forum som till exempel Flashback. 

– Vi har ju haft en ambition att få med så mycket som möjligt och då kan det ju ingå en del kontroversiellt material. Men vi tror inte att det är vår plats att ta censurbeslut. Det tror vi att man gör bäst när man vet vad man ska använda de här modellerna till, säger Ariel Ekgren.

Inte aktuellt att träna bort fördomar

Chat SW3 är en grundmodell som skulle kunna användas både inom offentlig sektor och som grund för kommersiella produkter.  

Kommersiella chattrobotar som chatGPT och sökmotorn Bing har tidigare fått kritik för att de har genererat rasistisk och på andra sätt olämplig text. Men att träna bort fördomar hos AI:n redan i grundstadiet är inte aktuellt, enligt Ekgren.  

– Både Bing och Chat GPT är vidareutvecklingar och produkter som bygger på språkmodeller. När man utvecklar sådana produkter är det jätteviktig att kontrollera vad de säger och förstå om de har någon bias. Men vi är ett steg före det så det är inte något vi behöver jobba aktivt med.

Så arbetar vi

SVT:s nyheter ska stå för saklighet och opartiskhet. Det vi publicerar ska vara sant och relevant. Vid akuta nyhetslägen kan det vara svårt att få alla fakta bekräftade, då ska vi berätta vad vi vet – och inte vet. Läs mer om hur vi arbetar.