Du benytter en nettleser vi ikke støtter. Se informasjon om nettlesere

Kapittel 1.2Språk og kultur i språkmodellar

For at ein språkmodell skal fungere i eit språksamfunn, må han vere trena på store tekstmengder på det aktuelle språket. Sjølv om innhaldet i ein internasjonal språkmodell automatisk blir omsett til norsk, vil det kunne oppstå framande ord og språklege vendingar, jamvel feilomsetjingar. Stil, tone og høflegheit varierer mellom ulike språk og kulturar, og det kan slå ut på uønskt måte ved bruk av éin internasjonal språkmodellar. I tillegg er det grunn til å tru at omsetjingar av medisinsk tekst vil by på utfordringar på grunn av svært domenespesifikt og spesialisert språk. Det gjeld især fagterminologi, sjargong, forkortingar og andre kjenneteikn ved språkbruk i t.d. journalføring.

Trening på store mengder norskspråklege tekstar vil i tillegg gje fag- og kulturrelevant innhald til språkmodellane, t.d. nasjonale behandlingsplanar på helsefeltet. Erfaringane frå uttesting av KI-modellen IBM Watson i Danmark for ein del år sidan synte problem med at modellen gav råd basert på amerikanske kreftbehandlingsplanar, som var annleis enn dei danske[11].

Sjølv om internasjonale språkmodellar som t.d. Med-PaLM og ChatGPT gjer det bra i internasjonale valideringar (med t.d. spørsmål og svar-sett), er det ingen garanti for at modellen fungerer i norsk helsefagleg kontekst.

Alternativet mellom å byggje ein norsk språkmodell frå botn eller å bruke ein internasjonal grunnmodell blir for tida testa ut og vurdert i NorwAI-satsinga (NTNU) og ved språkteknologigruppa (Language Technology Goup (LTG) ved UiO som pilot for NORA-satsinga. Resultatet vil vonleg vere klart i løpet av våren 2024.

 

[11] Barua, Ishita (2023) Kunstig intelligens redder liv. Cappelen Damm.

Siste faglige endring: 06. mai 2024