Tehnologija glasovnih naredbi - Siri vs. Google Now vs. Cortana - 3.0 out of 5 based on 4 votes
Tehnologija glasovnih naredbi - Siri vs. Google Now vs. Cortana

Tehnologija glasovnih naredbi - Siri vs. Google Now vs. Cortana

Kako Siri, Google Now, Cortana i sličan softver mijenja način na koji komuniciramo sa svojim uređajima

S nedavnim izlaskom Windowsa 10, Microsoft je u potpunosti prigrlio ideju izdavanja glasovnih naredbi operativnom sustav. Zašto npr. tražiti ikonu Firefoxa u Start izborniku ili upisivati “Firefox” u polje za pretragu kada svojem računalu već pri ulasku u sobu možete doviknuti da otvori Internet preglednik? Iako ovaj tip interakcije sam po sebi nije novost u industriji, velike tvrtke zadnjih godina polako ali sigurno otvaraju put naprednim digitalnim asistentima kao što su Siri, Google Now, Cortana i slični. To čine na način da konstantno nadograđuju umjetnu inteligenciju svojih pomoćnika, dajući im mogućnost da odrađuju sve kompleksnije zadatke i daju krajnje precizne odgovore na stalno rastući broj upita.

Od kada su prije nekoliko godina postali neizostavan dio opreme pametnih telefona, digitalni asistenti su temeljitije integrirani i u druge platforme. Poznati primjeri uključuju Google Now za Internet preglednike, Cortanu za Windowse, pametni Bluetooth zvučnik Amazon Echo te softver kodnog imena M za Facebook Messenger. I iako je tehnologija iza njih gotovo ista, razlike u završnim proizvodima itekako postoje. Neki od njih stavljaju veći naglasak na imitiranje ljudske osobnosti, neki rade proaktivno, a određeni asistenti će vam dati i kontrolu nad informacijama koje “znaju” o vama. No, svi od njih imaju nešto za ponuditi i nastoje iz korijena promijeniti glavni način na koji komuniciramo sa svojim elektroničkim uređajima.

 

Kako vam digitalni asistenti mogu pomoći?

Kao što smo već spomenuli, izdavanje jednostavnih glasovnih naredbi računalima nije ništa novo – PC-evi i Macovi ovu funkcionalnost podržavaju već preko deset godina. Pa ipak, potrošači su tehnologiju glasovnih naredbi počeli masovno prihvaćati tek 2011. Radi se, naravno, o godini izlaska originalne verzije Siri, digitalnog asistenta za iOS. Siri je mogla odgovarati na pitanja tipa “koliko je Hrvatska jučer odigrala protiv Bugarske”, “kako danas stoje dionice Intela” i “kada sutra izlazi sunce”.

Naravno, prvotna verzija ovog softvera je bila daleko od savršene i u mnogim slučajevima je i dalje vraćala samo rezultate Internet pretrage, odnosno nije razumjela kontekst korisničkog upita. Kroz godine su se Siri i ostali asistenti opametili, pa tako sada samostalno mogu otvarati i koristiti aplikacije kao što su e-mail, SMS, fotografije, kontakti te obavljati neke jednostavne radnje poput kupovine karata za kino ili rezerviranja stola u restoranu.

Posljednja novost u ovom pogledu jest sposobnost softvera da uči o vama i vašim navikama te posljedično pokušava predvidjeti vaše potrebe. Microsoft i Google se tako zadnjih godina hvale sposobnostima Google Nowa i Cortane da vas upozore o nadolazećem lošem vremenu ili prometnoj gužvi na lokaciji kroz koju ćete se provesti te da vas obavijeste o planiranim koncertima u vašoj blizini koji bi vas mogli zanimati. Uz autogenerirane notifikacije, tu je i mogućnost naručivanja vlastitih notifikacija koje možete vezati za vremenske vrijednosti poput doba dana i vremena, ali i određenu lokaciju. Želite da vas mobitel podsjeti da kupite pecivo kada ste u blizini pekare? Samo mu recite.

Sljedeći veliki korak za digitalne asistente jest automatizacija doma. Google Now već može upravljati uređajima proizvedenih od strane Winka i SmartThingsa, a u istom smjeru je krenuo i Amazon Echo, inteligentni Bluetooth zvučnik koji nažalost još uvijek nije dostupan na hrvatskom tržištu. Ova tehnologija trenutačno još uvijek podržava tek relativno jednostavne opcije poput onih za glasovno paljenje i gašenje svjetala te upravljanje bravama na vratima, no Google i Amazon su u više navrata obećali da velika poboljšanja u ovom pogledu slijede već početkom iduće godine.

 

Tehnologija iza digitalnih asistenata

Svi danas najnapredniji digitalni asistenti su bazirani na tehnologiji u oblaku. Drugim riječima, većina njihovih mogućnosti neće raditi bez veze s Internetom. Posljednje verzije Siri i Cortane doduše koriste lokalne resurse kada je god to moguće, no i dalje od njih ne možete očekivati previše u situacijama u kojima niste povezani na mrežu svih mreža.

Nakon Interneta, svi digitalni asistenti trebaju napredan speech-to-text softver. Analiziranje glasovnog upita je krajnje zeznuta stvar jer i unutar istog jezika postoji bezbroj raznoraznih narječja i dijalekata, kao i homonima, tj. istozvučnica, da ne spominjemo kako ne govore svi korisnici jednakom brzinom.

Kompleksnost problema prepoznavanja glasovnih komandi i analiziranja upita jest glavni razlog zašto osim engleskog današnji digitalni asistenti istinski govore jako mali broj jezika unatoč godinama razvoja. Da, Siri i Google Now podržavaju diktiranje na velikom broju jezika, uključujući i hrvatski, no i dalje ne mogu analizirati upite na većini tih istih jezika.

Upravo je analiziranje ili procesuiranje jezika sljedeći korak na zamršenom putu između vaših glasnica do ekrana pametnog telefona ili kakvog drugog uređaja. Svi postojeći sustavi koriste kombinaciju prepoznavanja ključnih riječi i analiziranja konteksta. I dok je prepoznavanje ključnih riječi lako za shvatiti, kod analiziranja konteksta dolazimo do jako zamršenog područja o kojima proizvođači ne vole pričati, vjerojatno zato što svi paranoično čuvaju svoje napredne algoritme koje koriste njihovi proizvodi.

Dvije činjenice su ipak poznate o ovom koraku. Kao prvo, moderni digitalni asistenti uče vaše obrasce govora i dnevne potrebe ne samo temeljem prijašnjih rezultata korištenja, već i temeljem prijašnjih neuspjelih pokušaja korištenja. Također, ova tehnologija ne uči samo iz korisničkog inputa, već i onog koji im daju njihovi proizvođači, odnosno rastućih baza podataka. Radi se o tzv. “dubinskom učenju” (deep learning) čija upotreba omogućava programima da daju organske odgovore na korisničke upite umjesto da programeri ručno kodiraju svaki odgovor posebno.

Radi se o istoj tehnologiji koja omogućava automatsku kategorizaciju fotografija prema različitim karakteristikama kakvu je nedavno predstavio popularni servis Flickr. Kao rezultat toga, Flickr uočava uzorke u ogromnim količinama podataka koje korisnici uploadaju te posljedično može automatski podijeliti fotografije prema kategorijama kao što su pejzaži, životinje, portreti i sl. Temeljem iste tehnologije Microsoftov Project Adam čiji su dijelovi već aktivni unutar Cortane raspoznaje razliku između fotografija ljudi i životinja te na upit relativno precizno čak može utvrditi i pseće pasmine.

I upravo u deep learningu leži temelj za budući napredak umjetne inteligencije digitalnih asistenata. Kako će developeri razvijati mogućnosti analize novih tipova sadržaja, naši virtualni pomoćnici će sve detaljnije moći analizirati naredbe koje im dajemo i podatke koje im prezentiramo. Gore spomenuti primjer detekcije pasmine bi se npr. lako mogao proširiti na traženje mobitela da “pogleda” vaš obrok kroz kameru pametnog telefona i prezentira vam informacije o nutricionističkim vrijednostima istog. Mogućnosti su doslovno neograničene, no kako digitalni asistenti izgleda nisu samo posljednji trend u svijetu tehnologije te imaju planove dugoročno ostati u našim uređajima, u bliskoj budućnosti im predviđamo dva problema.

Prvi je onaj glasovne detekcije; čak i najnapredniji softver na tržištu i dalje reagira na svačiji glas tako da se nerijetko može neočekivano aktivirati. Drugi je vezan za poslovne modele virtualnih pomoćnika. Kako se radi o softveru koji koristi tehnologiju u čiji su razvoj kroz godine ulupane basnoslovne svote novaca, činjenica da se isti mogu koristiti bez dodatnih naknada znači da uvijek morate pristati na uvjete korištenja u kojima stoji da vas proizvođač softvera može profilirati potrebe ciljanog oglašavanja analizom svog sadržaja kojem njegov digitalni asistent ima pristup.

Tu se, dakle, javlja staro pitanje privatnosti na Internetu s obzirom da se dobrog dijela istog morate odreći ako ćete htjeti uživati u najnovijim tehnološkim dostignućima koja nude Siri, Google Now, Cortana, i sl. Hoće li i kako tehnološka industrija odgovoriti na ova pitanja ostaje za vidjeti.

(Stranica 1 od 4)
« Prev All Pages Next » (Stranica 1 od 4)
Ocijeni sadržaj
(4 glasova)

Newsletter prijava


Kako izgleda naš posljednji newsletter pogledajte na ovom linku.

Skeniraj QR Code mobitelom i ponesi ovu stranicu sa sobom

Tehnologija glasovnih naredbi - Siri vs. Google Now vs. Cortana - VidiLAB - QR Code Friendly
Copyright © by: VIDI-TO d.o.o. Sva prava pridržana.