I/O konferencija
63

Googleova nova AI tehnologija može pronaći izgubljene naočale

D. B.
Google je pokazao AI sisteme koji mogu interpretirati informacije na fotografijama putem kamere mobitela, u video zapisima i zvukovima, kao i u govoru.

U jednoj demonstraciji je prototip asistenta pokretanog AI tehnologijom na mobitelu uspio odgovoriti na pitanje "gdje sam ostavio naočale".

Ova tehnologija je demonstrirana nakon što je Googleov rival OpenAi lansirao svoj novi AI sistem GPT-4o, koji je uključivao prezentaciju u kojoj je "čitao" ljudske izraze lica putem kamere mobitela, razgovarao i čak flertovao.

Čini se da Google želi naglasiti da su njegovi alati sposobni za ovu vrstu takozvanog multimodalnog razumijevanja, baš kao što je i njegov rival.

Kao znak ovog takmičenja u stilu "sve što možeš ti, ja mogu bolje", Google je nagovijestio mogućnosti svojih sistema na mobitelu uoči objave kompanije OpenAI.

Google je predstavio multimodalne funkcije u AI asistentu Gemini Nano, koji radi na uređaju, a korišten je Pixel smartphone te Gemini aplikacija. Demonstrirana je i funkcija upozorenja na prevaru, koja je testirana ga Gemini Nano. Asistent može "slušati" telefonski poziv i upozoriti korisnika ako se radi o prevari, no informacije o pozivu ne napuštaju smartphone ni u jednom trenutku.

Demonstracije AI tehnologije su upriličene na Googleovoj I/O konferenciji namijenjenoj developerima softvera. Sir Demis Hassabis, šef Google Deepminda, predstavio je projekt Astra, koji istražuje budućnost AI asistenata. Tokom demonstracije je asistent mogao odgovoriti na glasovno postavljena pitanja o tome šta "vidi" putem kamere smartphonea. Na kraju demonstracije je uposlenik Googlea upitao glasovnog asistenta gdje je ostavio naočale, a asistent mu je odgovorio da ih je "vidio" na obližnjem stolu.

Također, upriličena je i "živa" demonstracija korištenja videa prilikom pretraživanja Googlea. Google Search je predložio načine za popravak pokvarenog gramofona.

Tokom prezentacije se govorilo i AI pokretanoj pretrazi Google Photosa kkao bi se olakšala pretraga kolekcije fotografija, kao i o mogućnosti sumiranja svih emailova o određenoj temi, koja stiže na Gmail.

U budućnosti će sistem moći kreirati virtuelnog "asistenta", koji će moći izvršavati različite zadatke poput prisustvovanja na više online sastanaka istovremeno.