Googlek irudien oinak automatikoki idazteko prestatu du ikasketa automatikoko algoritmo bat

Iturria: MIT Technology Review 

Googleko ingeniariek ikasketa automatikoko algoritmo bat irudien oinak idazteko prestatu dute, itzulpen automatikorako erabiltzen dituzten teknika berberak baliatuz.

Sistema berri horrek automatikoki sortzen ditu irudien edukiak zehazki deskribatzen dituzten irudien oinak. Hori erabilgarria izango da bilatzaileetan erabiltzeko eta ikusmen-arazoak dituztenei Interneten nabigatzeko, nahiz mundu errealean ibiltzen laguntzeko.

Itzulpenak egiteko planteamendu konbentzionala hitzak banan-banan itzuliz hasten den prozesu iteratibo bat da eta gero hitzak eta esaldiak berrordenatzen dituena, itzulpena hobetzeko. Alabaina, azken urteotan, Googlek bere bilaketen datu-base erraldoia testuak beste era guztiz desberdin batez itzultzeko landu du.

Sistema horrek funtsean egiten duena da hitzak beste hitz batzuen ondoan edo hurbil zenbat bider agertzen diren zenbatu eta ondoren haiek erlazionatzen dituen bektore-espazio bat definitu. Horrela hitz bakoitza espazio horretako bektore batek ordezkatzen du eta esaldiak bektoreen konbinazioek ordezkatzen dituzte.

Horren oinarrian badago hipotesi bat: hitz jakinek erlazio berbera dutela beste hitzekin, edozein delarik ere hizkuntza. Adibidez, "errege - gizonezko + emakume = erregina" egia izango litzateke hizkuntza guztietan. Horren arabera, hizkuntzatik hizkuntzara itzultzea bektore-espazioen matematikako kontua da.

Google Translatek esaldi bakoitza bektore bihurtzen du eta gero bektore hori beste hizkuntza bateko esaldi baliokidea ekoizteko erabiltzen du.


Ikerketa horretan diharduen taldeak Google Brain deritzon proiektu bat garatu du, ikasketa sakoneko teknikak garatzeko, besteak beste, ordenagailuei giza hizketa ezagutzea irakasteko helburuarekin.

Talde horretan lan egiten duen zientzialarietako bat Oriol Vinyals kataluniarra da. Oriol Sabadellen jaio zen duela 31 urte, Telekomunikazioetako Ingeniaritza ikasi zuen Bartzelonako Universitat Politècnica de Catalunyan, formazio hori Centre de Formació Interdisciplinària Superior delakoan osatu ondoren, karrera-bukaerako proiektua AEBetako carnegie Mellon University-n egin zuen, 9 hilabeteko egonaldi bat egin zuen Berkeleyko Unibertsitatean, ikasketa automatikoan espezializatzeko, beste urtebete eman zuen San Diegon Informatikako master bat egiten eta 2009-2013 tartean doktoretza egiten, berriro ere Berkeleyn. Denbora horretan guztian, udako hilabeteetan egonaldiak egin zituen Microsoften eta Googlen, zenbait ikerlanetan parte hartzen.

Oriol Vinyals

Orain Googleko taldeak sare neuronal bat erabili du, 100.000 irudiko datu multzo bat eta irudi horien oinak aztertu eta irudien edukia nola sailkatu ikasteko. Baina irudia deskribatzen duten hitzen multzoa sortu ordez, haien algoritmoak hitzen arteko erlazioa ordezkatzen duen bektore bat sortzen du. Bektore hori gero Googleren itzulpen-algoritmoan txerta daiteke ingelesezko edo beste edozein hizkuntzatako oina ekoizteko. 

Prozedura horren eraginkortasuna probatzeko, giza ebaluatzaileak erabili zituzten, automatikoki sorturiko oinak ebaluatu zituztenak, beste prozedura automatiko batzuek eta gizakiek sorturiko oinekin konparatuz.

Proba horien emaitzek erakutsi dute sistema berriak, Googlek Neural Image Caption deritzonak, ondo funtzionatzen duela.

Comments

Popular posts from this blog

Euskaltzaindiaren Hiztegia. Euskara txukun erabiltzen laguntzen duen tresna.

Kale-neurketak eta kaleko neurketak

bozak, bozkak, bozketak, botoak