Bakgrunn
HOD har gitt Helsedirektoratet i oppdrag at som en del av videre arbeid skal etatene også identifisere tiltak for å sikre at helse- og omsorgstjenesten har tilgang på språkmodell(er) som er tilpasset norske forhold.[64]
Beskrivelsen av dette tiltaket baserer seg på anbefalingen om tilgang til språkmodeller tilpasset norske forhold (5.2) i kunnskapsgrunnlaget om bruk av store språkmodeller.[65]
Hva er problemet
Det er usikkert om tilgjengelige språkmodeller i stor nok grad tar hensyn til norsk språk (både bokmål og nynorsk), fagterminologi, kultur, etikk og praksis i helse- omsorgssektoren i tilstrekkelig grad. Det mangler norske testsett for å finne ut dette.
Hva vil vi oppnå
Målsetningen er at språkmodeller og/eller applikasjoner som baserer seg på store språkmodeller i helsesektoren fungerer godt nok til å utføre oppgaver i norsk sammenheng, samtidig som at internasjonal kunnskap skal være ivaretatt. Tekster for allmennheten bør være i klarspråk og pasientvennlige slik at de kan leses av pasienter, brukere, pårørende og innbyggere ellers. Tekster for helsepersonell bør være i tråd med norsk fagterminologi. Nynorsk skal fungere like godt som bokmål. Språkmodeller som skal anvendes i forvaltningsområdet for samiske språk, må fungere på samisk.
Hva skjer på området
Pr. 1. mars 2024 har følgende aktører initiativer knyttet til utvikling av store språkmodeller på norsk:
- NorwAI (NTNU o.a.) bygger p.t. på norske språkmodeller
- NORA (UiO, NB o.a.) bygger p.t. på norsk språkmodeller
- Helse Vest IKT finjusterer grunnmodellen NorBERT til kliniske domene: Klinisk NorBERT
Helsedirektoratet (og andre) tester ut tilpassing av internasjonale modeller gjennom såkalt RAG (Retrieval Augmented Generation) i for eksempel DigiUNG og Helsesvar.
Flere virksomheter, i både privat og offentlig sektor, har utviklet retningslinjer for bruk av generativ KI.[66]
Hvordan få det til
En rekke tiltak er mulig for å sikre tilgang på språkmodeller som er tilpasset norske forhold. Det er nødvendig med mer erfaring for å kunne treffe riktig tiltak. I første omgang vil det være viktig å følge med på resultatene fra de pågående initiativene.
Det skal utarbeides en rapport som skal identifisere tiltak for å sikre at helse- og omsorgstjenesten har tilgang på språkmodell(er) som er tilpasset norske forhold. Det kan gjøres gjennom følgende aktiviteter:
- Følge med og delta i nasjonale og/eller nordiske prosjekter som utvikler store norske språkmodeller som kan brukes i helse- og omsorgssektoren
- Analysere eventuelle behov for nasjonal helsefaglig språkmodell på bakgrunn av resultat fra pågående utviklingsprosjekt som blant annet Klinisk NorBERT, NorwAI og NORA.
- Følge med på prosjekter som tilpasser åpne, internasjonale modeller til norske forhold.
- Vurdere hvilke norske helsefaglige treningsdata som er relevante og i hvilken grad de er tilgjengelige for utvikling, trening og finjustering av språkmodeller, inkludert opphavsrett og personvern
- Utvikle norske testsett som kan brukes for å finne ut om språkmodeller er tilpasset norske forhold, og utvikle norsk benchmarking
- Tilgjengeliggjøre felles semantiske ressurser, for eksempel kunnskapsgrafer, til bruk i språkmodeller
- Analysere mulige forvaltningsregimer for ev. en eller flere nasjonale helsefaglige språkmodeller
- koordinere og samle relevante retningslinjer for bruk av utvikling av generativ KI og eventuelt oppfordre til at det utvikles retningslinjer på utvalgte områder i helse- og omsorgstjenesten
- Etablere oversikt over nasjonale og internasjonale datasett som er tilgjengelig for KI-forskning.
- Legge til rette for at terminologier og klassifikasjoner som er oversatt til norsk, kan berike språkmodeller
Hvem er ansvarlig
Helsedirektoratet
Hvem samarbeider
Fag- og FoU-miljø innen KI og språkteknologi (inkludert Nasjonalbiblioteket), sentrale forvaltningsorgan (inkludert Digitaliseringsdirektoratet og Datatilsynet), helse- og omsorgstjenesten og næringslivet gir innspill i arbeidet.
[64] Tildelingsbrev 20204-34:
[66] Digitaliseringsdirektoratet har utviklet retningslinjer for generativ KI: https://www.digdir.no/kunstig-intelligens/bruk-av-generativ-kunstig-intelligens-i-offentlig-sektor/4670#generelle_retningslinjer. Teknologirådet har samlet flere retningslinjer i offentlig sektor: https://teknologiradet.no/blogg/mens-vi-venter-pa-ai-act-retningslinjer-for-kunstig-intelligens/