Hizkuntzaren industrien Hungariako clusterra
Zoltan Varju hizkuntza-ingeniari hungariarrak Aftal webgunera igorritako informazioa.
Hizkuntza-teknologiaren industria txikia baina bizkorra da Hungarian. Berrikitan, enpresa nagusiek eta ikerketa-institutuek Hizketa- eta Hizkuntza-teknologiaren clusterra sortu dute. Ederra litzateke kide guztiez sakon idaztea, baina artikulu hau luzeegia litzateke. Zentra nadin hiru enpresa desberdin baina oso arrakastatsutan.
• Morphologic – Gábor Prószéky irakasle aitzindariak sortua. Jaun hori hizkuntza-teknologiari buruzko lehen ikasliburuaren egilea eta Péter Pázmány Unibertsitate Katolikoko Informatika Fakultateko dekanorde da. Enpresa hori, bere izenak iradokitzen duen bezala, analisi lingustikoaren ezagutza sakonean oinarrituriko soluzioak garatzen ari da. Morphologic-ek egin zituen MS Office-rako ortografia- eta gramatika-zuzentzaileak, eta tresna linguistikoz hornitzen ditu beste enpresa batzuk ere. Bere Ingeles/Hungariera, Hungariera/Ingelesa online itzultzaile automatikoak Google Translatek baino hobeto funtzionatzen du! (Morphologic-en webgunearen goiko eskuineko txokoan aurki dezakezu)
• Weblib – bilaketa (semantikoaren) arloan diharduen enpresa txiki bat da. bere bezeroentzat neurrira egindako bilaketak garatzen ari da (adibidez, Hungariako enplegu-webgunerik handienetako baterako, Bethesda, Maryland-eko National Library of Medicine-rako), Johu mantentzen du (Hungarieraren gramatikan espezializaturiko bilatzailea). Healthmash, osasun-arloko bilatzaile semantiko iraultzailea den enpresaren produktu berriak oso harrera ona izan du.
• Nuance Recognita – Recognitak OCR-rik aurreratuenetako bat garatu zuen, gero Nuance-ek erosi zuena. (Zoritxarrez, enpresak bere webgune propioa galdu egin zuen erosketaren ondorioz)
• Morphologic – Gábor Prószéky irakasle aitzindariak sortua. Jaun hori hizkuntza-teknologiari buruzko lehen ikasliburuaren egilea eta Péter Pázmány Unibertsitate Katolikoko Informatika Fakultateko dekanorde da. Enpresa hori, bere izenak iradokitzen duen bezala, analisi lingustikoaren ezagutza sakonean oinarrituriko soluzioak garatzen ari da. Morphologic-ek egin zituen MS Office-rako ortografia- eta gramatika-zuzentzaileak, eta tresna linguistikoz hornitzen ditu beste enpresa batzuk ere. Bere Ingeles/Hungariera, Hungariera/Ingelesa online itzultzaile automatikoak Google Translatek baino hobeto funtzionatzen du! (Morphologic-en webgunearen goiko eskuineko txokoan aurki dezakezu)
• Weblib – bilaketa (semantikoaren) arloan diharduen enpresa txiki bat da. bere bezeroentzat neurrira egindako bilaketak garatzen ari da (adibidez, Hungariako enplegu-webgunerik handienetako baterako, Bethesda, Maryland-eko National Library of Medicine-rako), Johu mantentzen du (Hungarieraren gramatikan espezializaturiko bilatzailea). Healthmash, osasun-arloko bilatzaile semantiko iraultzailea den enpresaren produktu berriak oso harrera ona izan du.
• Nuance Recognita – Recognitak OCR-rik aurreratuenetako bat garatu zuen, gero Nuance-ek erosi zuena. (Zoritxarrez, enpresak bere webgune propioa galdu egin zuen erosketaren ondorioz)
- Sektore akademikoa
Komunismo-garaian hizkuntzei buruzko planteamendu formalak sasizientzia burgestzat hartzen zituzten. Hori pixkanaka aldatuz joan zen, 1970eko hamarkadaren erditik aurrera, eta erakunde akademiko nagusiak gaur egungo ikergaietara bideratu ziren. Hungariako Zientzien Akademia da gaur egun hizkuntzalaritza konputazionalaren ikerketan erreferentzia nagusia. Oso etorkizun oparoko egitasmoak ditu Hizkuntzalaritza-Institutuak. Informatikaren eta automatizazioaren ikerketa laborategiko Hizkuntza-teknologiako taldearen buru András Kornai da, Mathematical Linguistics-en egilea (Springer-ek argitaratua).
Szeged-eko Unibertsitateko Hizkuntza-prozesamenduko taldeak funtsezko lana egiten du hungarierarako tresna estandarren garapenean; esate baterako, Penn estiloko treebank bat eta hungarierazko WordNet garatu ditu. Budapesteko Teknologia eta Ekonomia Unibertsitateko medioen ikerketarako eta hezkuntzarako MOKK ikertegia kode irekiko analizatzaile morfologikoak eta hungarieran web corpusak garatzen ari da, eta Hungariera/Ingelesa - Ingelesa/Hungariera corpus paraleloaren egitasmoa, gaur egun, spin-off enpresa gisa ari da funtzionatzen (bere webgunea hungarieraz soilik dago).
Linguistika konputazionala herrialdeko unibertsitate nagusi guztietan ikas dezakete ikasleek. Arloa hain askotarikoa baita, hizkuntzalaritzako nahiz informatikako departamentuek eskaintzen dituzte ikasketa horiek. Letretako fakultateetan, hizkuntzalaritzako diplomatura mailako hizkuntza-teknologia irakasgai osagarri gisa ikas dezakete eta masterretik gorako ikasketetan, espezializazio mailako programak eskaintzen dira. Budapesteko Unibertsitate Teknikoak zientzia kognitiboari buruzko gradua eskaintzen du, linguistika konputazionala proportzio dezentean duena. Hungariako garapen berezi gisa, humanitate digitaletako graduak linguistika konputazionalekoak dira, tradizionalak ez bezala. Péter Pázmány Unibertsitate Katolikoko Informatika Fakultatea da, hizkuntza-teknologiako espezialitatea informatikako ikasleei eskaintzen diena.
- Bizitza profesionala
Lehen ia ez zegoen bizitza profesionalik eta horregatik abiarazi genuen Számítógépes nyelvészet bloga (linguistika konputazionala adierazten duen hungarierazko terminoa). Ideiak eta jakintza komunitatearekin partekatzen ahalegintzen ditugun lau linguista konputazional gaztek osatzen dugu taldea. Batez ere hungarieraz blogatzen dugu, baina izaten dugu, gutxienez hilean behin, nazioarteko gonbidatu bat, gure irakurleei arloko azken garapenen berri ematen diena. Ingelesezko artikuluak http://formalthoughts.posterous.com/ helbidean argitaratzen ditugu, hungariarrak ez diren irakurleentzat.
Sinesten dugu zientziaren dibulgazioan, beraz, nyest.hu dibulgazio zientifikoko aldizkari digitalaren eskaintza onartu genuen eta publiko zabalarentzako linguistika konputazionalari buruzko artikuluak argitaratzen ditugu.
Sinesten dugu zientziaren dibulgazioan, beraz, nyest.hu dibulgazio zientifikoko aldizkari digitalaren eskaintza onartu genuen eta publiko zabalarentzako linguistika konputazionalari buruzko artikuluak argitaratzen ditugu.
Open Knowledge Foundation-en (OKFN) webgunea bisitatzea gomendatu nahi nizueke, haren helburuak ezagut ditzazuen. Uste dut fundazioa ekintza bikaina dela hizkuntzalariek arlo horretan indarrak batu ditzaten. The Comprehensive Knowledge Archive Network (CKAN) datuak bilatzeko eta partekatzeko gune bat da – zergatik ez dugu hizkuntzalaritzako datuz hornitzen?
Datuen analisia gure lanaren parte bihurtu da. Get the Data webgunea (Stackoverflow-ren antzekoa) aukerako solasgunea da, datuen analisiei buruzko galderak egiteko eta publikoarekin jakintza partekatzeko. Zure burua email batez aurkeztuz OKFN working group on open data in linguistics lantaldearen partaide bihur zaitezke eta han azter dezakezu zer egin dezakezun guztion onerako.
Comments
Post a Comment