En felles europeisk oversettelsestjeneste skal gjøre det raskere og billigere for offentlige etater og innbyggere å kommunisere og handle på tvers av språkbarrierer og landegrenser.

Mange virksomheter bruker mye tid og store ressurser på oversettelse. 8. juni 2016 arrangerte Difi, i samarbeid med EU-kommisjonen og Universitetet i Bergen, en workshop om automatisk oversettelse.

Byggekloss i EUs digitale indre marked

EUs automatisk oversettelsestjeneste, CEF.AT, er en byggekloss i EUs program Connecting Europe Facility (CEF). Programmet skal realisere en felles digital infrastruktur for kommunikasjon og handel på tvers av landegrenser. Norge og Island er medlem av programmet, og Difi er tildelt ansvar for å koordinere aktuelle aktiviteter i Norge.

Stor interesse

Mer enn 50 representanter fra ulike etater og organisasjoner, blant annet BLD, UD, UDI, NAV, Skatteetaten, Brønnøysundregistrene, IMDi, Statens vegvesen, Språkbanken, Språkrådet, Lovdata og NHH, deltok på workshopen.

Interessen blant offentlige etater i Norge for EUs automatisk oversettelsestjeneste er stor.
 

Interessen blant offentlige etater i Norge for EUs automatisk oversettelsestjeneste er stor.

Deltakerne ga ros til EU-kommisjonen og Difi for initiativet om workshopen og agenda for dagen. De var aktive med å holde innlegg og beskrive deres behov og utfordringer med å jobbe med flerspråklige tjenester innen deres respektive fagområder. De var enige at det var på tide at representanter fra det offentlige samlet seg på tvers av sektorene og drøftet dette temaet.

Fersk rapport fra KMD

På workshopen la Oslo Economics frem en rapport, Kartlegging av behovet for automatisk oversettelse i statlig sektor. Rapporten er utført på vegne av Kommunal- og moderniseringsdepartementet (KMD). Rapportens konklusjon stemmer med meninger uttrykt av workshopdeltakerne; et automatisk oversettelsesverktøy som er tilpasset norsk språk vil hjelpe forvaltningen til å kommunisere på tvers av landegrenser og språkbarriere mer effektivt og med reduserte kostnader.

Rapporten skisserer ulike alternativer for å gå fram med arbeidet for tilpasning av CEF.AT til norsk språk. CEF.AT trenger en god datakorpus (samling av datafiler som inneholder oversatte tekster og metadata) for at systemet kan håndtere oversettelse til og fra ulike språk. Innhenting av eksisterende korpussegmenter (datafiler med oversatte tekster) og kontinuerlig levering av nye korpussegmenter i rett filformat til kommisjonens system anbefales. Det vil være den mest effektive og kostbesparende måten å styrke datakorpusen til CEF.AT på, og forbedre kvaliteten på systemets håndtering av det norske språket.

Penger å spare

EU-kommisjonen innfører CEF.AT for å spare penger og modernisere EU. Det handler ikke om å kvitte seg med profesjonelle oversettere, for når det gjelder oversettelse av tekster på et høyt faglig nivå kan ikke maskin måle seg mot menneske. Det handler om å jobbe smartere og raskere.

I Norge ligger ansvar for oversettelse av tekster og tilrettelegging av informasjon for ulike brukergrupper hos den enkelte etat. I følge rapporten til KMD bruker Utenriksdepartementet mest ressurser på oversettelse. De bruker 4,8 millioner kroner årlig til innkjøp av oversettelse fra eksterne oversettere. Justisdepartementets forbruk er på ca. 1,2 million kroner årlig. Forbruket til Statens vegvesen, Sjøfartsdirektoratet og Finanstilsynet er estimert til ca. 370 000 kroner årlig. I tillegg har disse etatene kostnader i form av ressursbruk til egne interne oversettere. I andre etater er oversettelsesoppgaver løst av egne ansatte eller med bestilling av tjenester fra eksterne oversetterbyråer. Bestillinger er ad hoc for hvert oversettelsesoppdrag. Etater mangler ofte oversikt over hvilken dokumenter de har oversatt. De mangler et system for å ta vare på og gjenbruke datafiler med både kildetekster og oversatte tekster.

Hvordan kan etatene jobbe smartere og samarbeide om oversettelse? Er det på tide for en fellesstrategi for oversettelse i det offentlige i Norge? I Irland, Spania og delvis i Finland og Nederland er oversettelsestjenester for det offentlige sentralisert. Er det noe for Norge å vurdere? 

​Det er lite tvil om at det offentlige vil spare mye tid og penger dersom man samordner måten de jobber med oversettelse på. Dersom oversatte tekstfiler og automatiske oversettelsesminner som er i bruk i det offentlige samles og deles vil vi effektivisere måten vi jobber med oversettelse på. Det vil også bidra til utvikling av språkteknologi og nye grenseskridende digitale tjenester.

Styrke brukerrettigheter

CEF.AT er mer enn en europeisk vri på Google Translate. Dersom verktøyet tilpasses det norske språket vil offentlige etater ikke bare kunne bruke det som støtte for tekstoversettelse, men også som en byggekloss for å lage automatisk flerspråklige versjoner av egne nettsider og utvikle flerspråklige grenseskridende digitale tjenester.

Barne- og likestillingsdepartementet ved Eva Tverberg fortalte om Norges kommende tilkobling til den europeiske klageportalen, Online Dispute Resolution. Fra februar 2017 skal norske forbrukere kunne bruke portalen for å klage på dårlige varer eller tjenester de har kjøpt i utlandet. Man skriver direkte inn i portalen på norsk, og den skriftlige klagen mottas digitalt, for eksempel av en hotelleier i Tyrkia, og via automatisk oversettelsesverktøyet kan hotellansvarlige lese og svare på klagen på sitt morsmål. Utfordringen er at kvalitet på norsk oversettelse i portalen må forbedres.

Trenger datasett

Oversettelsessystemet til EU-kommisjonen er basert på maskinlæring. Systemet trenger en datakorpus, gjerne på ulike språk, fra ulike fagområder. Det kan for eksempel være filer fra oversettelsesverktøy, nettsidetekster, vokabularer - alt som innebærer ord. Systemet bruker filene til å gjenkjenne og lære ulike språk.

EU kommisjonen trenger tekstbaserte datafiler for å styrke oversettelsesverktøyet CEF.AT
 

Andrejs Vasiljevs fra EU-kommisjonen trenger tekstbaserte datafiler for å styrke CEF.AT

Kommisjonen ønsker seg norske språkressurser som kan mates inn i CEF.AT for at verktøyet skal lære seg det norske språket. NHH som har ansvar for Termportalen i samarbeid med Universitetet i Oslo og Universitetet i Bergen deltok på workshopen og fortalte om deres innsamling av språkdata, ikke minst gjennom prosjektet, CLARINO. De er viktige potensielle samarbeidspartnere for EU-kommisjonens CEF.AT-prosjekt.

Jo flere jo bedre, sier kommisjonen om deres behov for tekstbaserte datafiler. Det er behov for tekstbaserte datafiler fra flere offentlige etater og sektorer i Norge. Seniorrådgiver Øystein Åsnes, som jobber med åpne data hos Difi, sa på workshopen at det slett ikke er sikkert at norske offentlige etater har oversikt over sine datasett, eller er klar over hvilke datasett som kan være nyttige å dele. Men med bevisstgjøring, kan data deles og benyttes av flere, sier han.

Til gjengjeld for levering av datakorpus sier Kommisjonen at databasen med de innsamlete data vil være tilgjengelige for alle, og CEF.AT-verktøyet vil være gratis for offentlige etater eller organisasjoner til å ta i bruk.

Mer enn bare bokmål

I rapporten til KMD og Oslo Economics fremmes det forslag om en satsing først og fremst på bokmål i kommisjonens verktøy CEF.AT. Naturligvis vekker dette oppsikt, ikke minst hos Språkrådet. Dersom man ønsker å styrke det norske språket, bør ikke nynorsk også være med? Og hva med samisk?

Behov for oversettelsesverktøy og språkstøtte dreier seg ikke bare om oversettelse mellom norsk og europeiske språk. IMDis representant, Mona Myran informerte deltakerne på workshopen at mer enn 300 språk brukes i Norge i dag. UDIs representant under workshopen, Peder Nicolai S. Omenaas kunne bekrefte at behov for oversettelse i deres nyutviklet ankomstlogistikkløsning «Flyt» er tilpasset de 14 mest sentrale språkene for asylsøkere. Oversettelse av tekster i denne løsningen er per i dag ikke støttet av noen automatisk oversettelsesverktøy.

Kommisjonen – og Norge – har en utfordring med dette. Selv om EU utvikler et verktøy for de europeiske språkene, er gatespråk til borgere i Europa i dag ikke nødvendigvis europeiske, men kanskje somalisk, arabisk, urdu og kinesisk.

Difi koordinerer videre

Konklusjonen på slutten av workshopen i juni var at automatisk oversettelse er noe som det er stor interesse og behov for, hos flere offentlige etater i Norge. Det er også et område som trenger oppfølging og koordinering.

Uavhengig av organisering og eventuelt strategiarbeid i Norge, arbeider EU-kommisjonen med hvert medlemsland om datainnsamling for CEF.AT. Kontakt oss hvis du har interesse for, og kan bidra med, styrking av det norske språket i CEF.AT.  

Forfatter

Sarah Jane Hails Gjelsten
Sarah Jane Hails Gjelsten
Sarah Jane Hails Gjelsten er seniorrådgiver i avdeling for digital forvaltning, Leikanger, mobil 90660944, Sarah.Jane.Hails.Gjelsten@difi.no

Kommentarer

Skriv ny kommentar

* obligatorisk felt som du må fylle ut for å sende skjemaet.