Valideringsdata blir brukt til å validere språkmodellen med omsyn til m.a. yting og kvalitet.
Validering kan skje på ulike måtar. Intern validering målar ytinga til modellen på ein tilfeldig del av det opphavlege datasettet, som er trekt ut på førehand og halde unna modelltreninga. Ekstern validering målar ytinga til modellen på eit uavhengig datasett, og blir utført av ein uavhengig instans.
Som ved instruksjonsdatasett, så er ein avhengig av datasett som er tilpassa norsk helsefagleg praksis.