Maskinkorrespondent. Et nyt banebrydende computerprogram, Sunbeam, kan ved hjælp af matematiske udregninger lære at oversætte tekster. Udviklingen startede som et forskningsprojekt, men i går blev det lanceret kommercielt af Lingtech.
Et nyt computerprogram, der anvender statistik til maskinel oversættelse af tekster, kan gennem træning lære at oversætte tekster mellem forskellige sprog.
Op til 80 procent af arbejdet ved oversættelser kan skæres væk, idet computeren klarer arbejdet, og jo mere, programmet bruges, desto højere bliver kvaliteten af oversættelsen.
De to københavnske firmaer, Lingtech og Languagelens, lancerede i går computerprogrammet Sunbeam, som kan anvendes til oversættelse af tekster.
Personerne i de to firmaer mødtes i 2006, hvor de deltog i et forskningsprojekt under Videnskabsministeriet, og hvor de forskede i at bruge statistik til maskinel oversættelse af sprog. Forskningen viste, at det godt kunne lade sig gøre, at træne en computer op til med stor statistisk sandsynlighed at beregne en oversættelse.
Efter at forskningsprojektet var afsluttet, henvendte direktør Birgit Pichat fra Lingtech sig til Ph.d studerende Jakob Elming og lektor Dan Hardt fra Handelshøjskolen i København.
Hun foreslog i foråret i 2007, at de omsatte forskningsresultaterne til noget kommercielt. De to forskere stiftede derefter virksomheden Languagelens, og gik i gang med at kode Sunbeam. Samarbejdet mellem Languagelens og Lingtech består i, at førstnævnte ejer koden til Sunbeam, mens sidstnævnte har det kommercielle ansvar for salg og markedsføring.
»Det handler om at bygge en database op i sprog og i faglige områder. Og når computeren har lavet en oversættelse, færdiggøres oversættelsen manuelt af en korrespondent. Den oversatte tekst læses ind i databasen, og dermed kan computeren lære at lave bedre oversættelser fremover, fordi jo flere tekster, der læses ind i databasen, desto bedre bliver programmet til at oversætte,« siger adm. dir. Birgit Pichat, Lingtech.
Matematik
Lingtech har gennem mange år brugt et oversættelsessystem. Det nye er, at nu bruges der et maskinoversættelsessystem, der baserer sig på matematik. Oversættelserne foregår ved, at læse store mængder tekst ind af tidligere oversættelser på dansk og engelsk.Når de er lagt ind, oversætter programmet ny tekst baseret på de tidligere tekster. Systemet tjekker de mulige oversættelser det kender, for hver del af sætningen, og vælger den mest sandsynlige oversættelse i forhold til de omgivelser sætningen optræder i. På den måde bliver både ord og grammatik tjekket.
Programmet er lanceret i dag og bruges på nuværende tidspunkt internt i virksomheden. Men indenfor området patenter har Lingtech opbygget en database der rummer 24 millioner ord. Den fungerer i dag helt efter hensigten til oversættelser mellem dansk og engelsk, og i nær fremtid vil den også blive anvendt til oversættelse mellem engelsk og svensk. Ph.d studerende og medstifter af Languagelens, Jakob Elming fortæller, at det er kendt teknologi, der er bygget videre på.
»Det er først i de seneste år, at det har været muligt at komme så vidt, fordi der tidligere ikke har været computerkraft nok til at udnytte de store mængder tekst, der skal lægges ind til at træne programmet,« siger Jakob Elming.
Ifølge Birgit Pichat henvender Lingtech sig til virksomheder, som har behov for oversættelser og som bruger meget tid på det. Det kan være it-firmaer, der laver manualer til computere og om programmer. Medicinalvirksomheder, som laver produktbeskrivelser på mange sprog. Elektronikvirksomheder og bilfabrikanter.
»De vil løbende have behov for at oversætte tekster til produkter, brochurer, hjemmesider, salgspræsentationer. Her vil en velfungerende database med mange ord til hvert sprog og til hvert område, kunne spare mellem 60 og 80 procent af oversættelsesarbejdet,« siger Birgit Pichat.
Hun understreger, at firmaerne ikke bare kan publicere oversættelserne. Det kræver en manuel gennemgang efter oversættelsen.
Ifølge Matthias Buch-Kromann, der er forskergruppeansvarlig på Institut for Internationale Sprogstudier og Vidensteknologi på Handelshøjskolen i København er Sunbeam en ny type af it-systemer, der kan lære af sig selv, et såkaldt intelligent system. Ved at programmet kan lære af indlæste oversættelser, kan det hele tiden blive bedre.


