Samisk språkteknologi 2002

Rapport fra Trond Trosterud,
Samisk institutt, Universitetet i Tromsø

Prosjekt 200104097-44

Økonomisk støtte til prosjektet “Samisk språkteknologi”.

Eg søkte på vegne av prosjektet “Samisk språkteknologi” (jf. prosjektets eigne heimesider, prosjektet sine eksterne heimesider, http://www.hum.uit.no/sam/giellatekno/)
pengar til å lønne studentar til å arbeide på prosjektet, og fekk innvilga søknaden. Til å lønne studentar har eg hatt finansiering frå to ulike kjelder, frå Samisk senter og frå Norsk forskingsråd.

Det har vist seg vanskeleg å få studentar til å arbeide så mykje med prosjektet som har vore naudsynt, men i løpet av perioden har Lene Antonsen, Børre Gaup, Anne Berit Bals og Lena Gaup alle arbeidd på prosjektet. Alle pengane er framleis ikkje brukt opp, men arbeidskraftsituasjonen ser no lysare ut, og eg reknar med at dei vil bli brukt opp i løpet av vårsemesteret.

Studentane har arbeidd med å leggje inn samiske stadnamn, med testing av parsaren, og med lingvistiske forbetringar av visse delar av parsaren, framfor alt med handsaminga av to- og fleirledda samansetjingar og med generering av morfologiske paradigme.

Resultatet av arbeidet som har vore gjennomført har vore svært positivt. Parsaren har fått langt betre attendemeldingsprosent (recall) i løpet av denne perioden (frå 90.1 % til 94.6 % for ordformer og frå 70.0 % til 77.5 % for ordformtyper på ukjend administrativ tekst, og til 99.0 % og 94.1 på treningskorpuset (rein samisk tekst). Parsaren er tilgjengeleg på nett, og blir oppdatert kvar natt, jf. http://www.hum.uit.no/sam/giellatekno/.

This entry was posted in Researcher and tagged , , , , . Bookmark the permalink.