Keel ja tehnoloogia

[ Selle teksti tõi Einar Meister (TTÜ Küberneetika Instituudi foneetika ja kõnetehnoloogia labori juhataja) kaasa kui rääkisime mõni aeg tagasi Tehnokratis keeletehnoloogiatest. Avaldatud siinkohal autori lahkel loal -pets- ]

Kas eesti keel on infoühiskonnas ohustatud?

Personaalarvutite, Interneti ja mobiilside tormiline areng on oluliselt muutnud meie elu ja tööstiili: arvuti ja mobiiltelefon on paljude inimeste jaoks põhilisteks töövahenditeks, Internet on osa meie elu- ja töökeskkonnast. Oleme jõudnud või jõudmas infoühiskonda, kus kaubaks on informatsioon. Paraku eksisteerib see kaup suures osas keelelisel kujul.

Hinnanguliselt on ca 80% Internetis levivast informatsioonist inglisekeelne, arvutite operatsioonisüsteemid ja enamik laialt kasutatavaid programme on samuti inglisekeelsete menüüde ja juhistega.

Infotehnoloogia areng liigub arvutiga loomulikus keeles suhtlemise poole. Mitmete keelte puhul on see osaliselt võimalik juba täna. Enamik maailma juhtivatest info- ja kommunikatsioonitehnoloogia arengut mõjutavatest firmadest (IBM, Microsoft, Philips, Canon, Xerox, Ericsson, Nokia jpt) on viimastel aastatel väga palju investeerinud loomulikus keeles suhtlemist võimaldava tehnoloogia uuringutesse ja arendusse. Kõnetuvastus ja -süntees on mõne aasta pärast personaalarvutite operatsioonisüsteemide loomulikud komponendid.

Murranguks IT arengus saab olema kindlasti klaviatuurita arvuti turuletulek, mida prognoositakse aastateks 2005-2007. Kogu suhtlus arvutiga peaks toimuma siis inimkõne vahendusel, seega arvuti on võimeline tuvastama ja mõistma sidusat inimkõnet.

Tehnoloogiaarengut mõjutab eelkõige turg ja uue tehnoloogia kasutuselevõtust saadav kasum. Keeletehnoloogia toodete puhul määrab turu suuruse – ja seega ka kasumi – keel või õigemini keelt kõnelevate/kasutavate inimeste hulk. IT valdkonnas on vaieldamatult juhtivaks keeleks inglise keel ja seetõttu on investeeringud suunatud eelkõige inglisekeelse tehnoloogia väljatöötamisele.

Kuna iga keel on oma olemuselt unikaalne, siis ei ole võimalik ühe keele tarvis loodud tehnoloogiat lihtsalt rakendada mingi teise keele puhul. Loomulikult on teatud tehnoloogilised komponendid universaalsed, st. keelest sõltumatud, kuid need moodustavad ainult ligikaudu poole. Ülejäänud komponendid on rangelt keelespetsiifilised ja nõuavad väljatöötluseks küllalt palju ressursse. Tehnoloogiaarendus on majanduslikult otstarbekas ainult keelte puhul, mille kõnelejate arv on üle 10 miljoni, väiksemate keelte korral ei taga turunõudlus arenduseks vajalikke ressursse.

Eesti keel oma 1 miljoni kõnelejaga on liialt väike tekitamaks keeletehnoloogiat arendavate firmade huvi eesti keelele sobivate tehnoloogiliste lahenduste väljatöötamiseks.

Eesti on olnud väga edumeelne juurutama uusimat IT ja kommunikatsioonitehnoloogiat. Senine tehnoloogiaareng ei ole otseselt piiranud eesti keele kasutusvõimalusi. Klaviatuurita arvuti hakkab seda piirama, sest kindlasti ei saa me suhelda arvutiga eesti keeles, vaid peame kasutama selleks näiteks inglise, saksa, prantsuse, hiina või jaapani keelt. Alternatiiviks on muidugi võimalus mitte loobuda klaviatuurist, kuid see hakkab oluliselt piirama meie majanduslikku arengut ja konkurentsivõimet. Aeg on raha ja klaviatuuri kasutades kulub meil paratamatult rohkem aega mitmesuguste arvuti abil teostatavate toimingute sooritamiseks võrreldes kõnekäskluste esitamiseks kuluva ajaga.

Seega hakkab uus tehnoloogia piirama eesti keele kasutusvõimalusi ja tekib reaalne oht eesti keele väljatõrjumiseks paljudest eluvaldkondadest.

Milline on rahvuskeelte tulevik infoühiskonnas?

Microsoft’i nägemus: keeled, mida Microsoft elektrooniliselt ei toeta, hakkavad tasapisi välja surema.

Euroopa Liidu nägemus: iga rahvuskeele jaoks tuleb luua keeletehnoloogilised ressursid ja -vahendid, mis tagavad kõigile keeltele võrdsed võimalused suhtlemiseks infotehnoloogilises keskkonnas.

Paljud riigid maailmas on mõistnud, et oma keelelise ja kultuurilise identiteedi säilitamiseks infoühiskonnas on vajalik rahvuskeelsete tehnoloogiliste vahendite väljatöötamine. Nii on käivitatud rahvuslikud keeletehnoloogia arendusprogrammid ja selleks vajalikud alusuuringud näiteks Kreekas, Itaalias, Hollandis, Prantsusmaal, Soomes, Hiinas, Jaapanis jt riikides.

Soome näide:

Ka soome keel oma 5 miljoni kõnelejaga on liialt väike ja keeletehnoloogia arendus ei saa toimuda ainult turunõudluse toel. Soomekeelse tehnoloogiaarenduse toetamiseks on käivitatud kaks olulist programmi:

  1. Rahvuslik keeletehnoloogia arendusprogramm USIX (Uusi käyttäjäkeskeinen tietotekniika), mille eesmärgiks on soomekeelse infotehnoloogilise keskkonna loomiseks vajalike uuringute ja arendustööde toetamine. Aastateks 1999-2002 on programmi hinnanguline maht 350-400 miljonit marka, millest 150 miljonit on TEKES’i osa.
  2. Keeletehnoloogia õpetuse võrgustik, mille eesmärgiks on välja töötada keeletehnoloogia õppekavad ja käivitada keeletehnoloogia spetsialistide ettevalmistus Soome ülikoolides. Aastateks 2001-2003 on eraldatud selleks 8 miljonit marka aastas.

Kuidas toetatakse keeletehnoloogia uuringuid ja arendust Eestis?

Eestis on põhiliselt kolm keeletehnoloogia uuringute ja arendusega tegelevat asutust:

  • Tartu Ülikool: tekstikorpused, morfoloogiline, süntaktiline ja semantiline analüüs, tesaurus, dialoogi strateegiad,
  • Eesti Keele Instituut: arvutisõnastikud, automaatne morfoloogia, kõne analüüs ja süntees,
  • TTÜ Küberneetika Instituut: kõnesignaalide akustilis-foneetilised uuringud, kõnesüntees, kõne- ja kõnelejatuvastus, kõne andmebaasid.

Nende uurimisrühmade tööd finantseeritakse järgmistest allikatest:

  • riigieelarveline sihtfinantseerimine erinevate teadusteemade raames,
  • ETFi grandid,
  • riiklik programm “Eesti keel ja rahvuskultuur”,
  • Eesti Keeletehnoloogia Sihtprogramm (Eesti Informaatikakeskuse eelarvest).

Otseselt keeletehnoloogia osa eelnimetatud allikatest on ligikaudu 1,5 – 2 miljonit aastas. Ainus otseselt keeletehnoloogiale suunatud programm on KT Sihtprogramm, millele 1998.a. eraldati 1 miljon, 1999.a. – 0,8 miljonit, 2000.a. – 0,1 miljonit, 2001.a. – 0 krooni!

Mida peaks tegema Eestis?

Võimalikud variandid:

  1. Pole vaja midagi teha – lepime olukorraga, et infotehnoloogiline keskkond on valdavalt inglisekeelne.
    Prognoos: eesti keel ei ole tulevikus kasutatav kõigis elu- ja töövaldkondades.
  2. Ostame sisse inglisekeelsed programmid ja anname need häkkeritele, küll häkkerid teevad need eestikeelseteks.
    Prognoos: eestikeelset tehnoloogiat ei teki, sest inglise keele jaoks loodud lahendused ei sobi eesti keele jaoks põhimõtteliselt.
  3. Ootame, et mõni välismaine tehnoloogiat arendav firma loob sobivad lahendused ka eesti keele jaoks.
    Prognoos: eestikeelne turg on liialt väike tekitamaks lähiaastatel välisfirmades majanduslikku huvi, kaugemas perspektiivis võib see olla siiski võimalik.
  4. Teadvustame probleemi tõsidust riiklikul tasandil ja käivitame rahvusliku keeletehnoloogia arendusprogrammi koos vastavate alusuuringutega ning spetsialistide ettevalmistusega.
    Prognoos: 2-3 aasta pärast oleksid loodud uurimis- ja arendustöödeks vajalikud põhilised keeleressursid, 3-4 aasta pärast oleksid olemas esimesed laiale tarbijaskonnale suunatud tooted (grammatika kontrollija, piiratud sõnavaraga kõnetuvastus, jne.).

Eesti keelele teiste keeltega võrdväärsete võimaluste loomine suhtluseks infoühiskonnas peaks olema üks Eesti riigi prioriteetidest. Eestluse kandjateks on eelkõige meie keel, kultuur ja elulaad, mitte meie geenid.

  • Larko

    Ma ei taha vaielda hr Einar Meistri probleemipüstitusele, analüüsile ja paraku mitte tema eelistustele vastu. Kõik, mida ta oma artiklis kirjutab, on õige. Kõik tema soovitused on arukad, ja rumal oleks selline valitsus, kes nende täitmisest kõrvale hoiduks. Siiski oleks mul üks tagasihoidlik märkus.

    Ma ei nimelt saa uskuda, et klaviatuurita arvuti turule tulek peaks automaatselt klaviatuurilise kadumist tähendama. Inimkond oskas nimelt juba ammu enne kõneleda kui ta lugema ja kirjutama õpis. Ega ta sellepärast kõne teel suhtlemist maha ei jätnud, et uus tehnoloogia kirjaoskuse kujul tekis. Nii saab ka arvuti puhul käima.

    Igasuguse IT-tehnoloogia edukale kasutamisele eelduseks on see asjaolu, et lai üldsus, härra ja proua Harju Keskmine, on nõus seda kasutama. Kuigi kõnesünteesi teel töötav arvuti päris kindlasti tulevikus oma poolehoidjaid pälvib, jääb ka suur hulk inimesi – igas rahvuses ja iga keele kõnelejates – kes siiski eelistavad arvutiga kirjalikult suhelda. Mina näiteks kuulun viimasesse kategooriasse sel lihtsal põhjusel, et mul on kergem oma mõteid kirja kui kõne teel avaldada, seda päris mitmes keelesgi.

    Eriti emakeele päeval ei jagaks hr Meistri pessimistlikust eesti keele tuleviku suhtes. Kuid olen kõiges muus olulises temaga nõus.

  • Viimane veerg

    Mina olen Peeter Marvet (pets@tehnokratt.net). Ei saa täielikult välistada, et see siin oli kunagi minu ajaveeb. Kirjapandu ei pruugi väljendada seisu- ega istmekohti. Seoses surutisega esilehe mahtu vähendatud 8%. Lisandub käibemaks, Tallinna elanikel ka müügi- ja paadimaks. Pakendatud gaasikeskkonda. Valmistatud arvutis milles võib leiduda väheses koguses piima- ja pähklitükke. Ei sisalda hüdrogeenitud (transarasvavabasid) taimseid rasvhappeid, sisaldab vahustatud lämmastikku.