S nedavnim izlaskom Windowsa 10, Microsoft je u potpunosti prigrlio ideju izdavanja glasovnih naredbi operativnom sustav. Zašto npr. tražiti ikonu Firefoxa u Start izborniku ili upisivati “Firefox” u polje za pretragu kada svojem računalu već pri ulasku u sobu možete doviknuti da otvori Internet preglednik? Iako ovaj tip interakcije sam po sebi nije novost u industriji, velike tvrtke zadnjih godina polako ali sigurno otvaraju put naprednim digitalnim asistentima kao što su Siri, Google Now, Cortana i slični. To čine na način da konstantno nadograđuju umjetnu inteligenciju svojih pomoćnika, dajući im mogućnost da odrađuju sve kompleksnije zadatke i daju krajnje precizne odgovore na stalno rastući broj upita.
Od kada su prije nekoliko godina postali neizostavan dio opreme pametnih telefona, digitalni asistenti su temeljitije integrirani i u druge platforme. Poznati primjeri uključuju Google Now za Internet preglednike, Cortanu za Windowse, pametni Bluetooth zvučnik Amazon Echo te softver kodnog imena M za Facebook Messenger. I iako je tehnologija iza njih gotovo ista, razlike u završnim proizvodima itekako postoje. Neki od njih stavljaju veći naglasak na imitiranje ljudske osobnosti, neki rade proaktivno, a određeni asistenti će vam dati i kontrolu nad informacijama koje “znaju” o vama. No, svi od njih imaju nešto za ponuditi i nastoje iz korijena promijeniti glavni način na koji komuniciramo sa svojim elektroničkim uređajima.
Kako vam digitalni asistenti mogu pomoći?
Kao što smo već spomenuli, izdavanje jednostavnih glasovnih naredbi računalima nije ništa novo – PC-evi i Macovi ovu funkcionalnost podržavaju već preko deset godina. Pa ipak, potrošači su tehnologiju glasovnih naredbi počeli masovno prihvaćati tek 2011. Radi se, naravno, o godini izlaska originalne verzije Siri, digitalnog asistenta za iOS. Siri je mogla odgovarati na pitanja tipa “koliko je Hrvatska jučer odigrala protiv Bugarske”, “kako danas stoje dionice Intela” i “kada sutra izlazi sunce”.
Naravno, prvotna verzija ovog softvera je bila daleko od savršene i u mnogim slučajevima je i dalje vraćala samo rezultate Internet pretrage, odnosno nije razumjela kontekst korisničkog upita. Kroz godine su se Siri i ostali asistenti opametili, pa tako sada samostalno mogu otvarati i koristiti aplikacije kao što su e-mail, SMS, fotografije, kontakti te obavljati neke jednostavne radnje poput kupovine karata za kino ili rezerviranja stola u restoranu.
Posljednja novost u ovom pogledu jest sposobnost softvera da uči o vama i vašim navikama te posljedično pokušava predvidjeti vaše potrebe. Microsoft i Google se tako zadnjih godina hvale sposobnostima Google Nowa i Cortane da vas upozore o nadolazećem lošem vremenu ili prometnoj gužvi na lokaciji kroz koju ćete se provesti te da vas obavijeste o planiranim koncertima u vašoj blizini koji bi vas mogli zanimati. Uz autogenerirane notifikacije, tu je i mogućnost naručivanja vlastitih notifikacija koje možete vezati za vremenske vrijednosti poput doba dana i vremena, ali i određenu lokaciju. Želite da vas mobitel podsjeti da kupite pecivo kada ste u blizini pekare? Samo mu recite.
Sljedeći veliki korak za digitalne asistente jest automatizacija doma. Google Now već može upravljati uređajima proizvedenih od strane Winka i SmartThingsa, a u istom smjeru je krenuo i Amazon Echo, inteligentni Bluetooth zvučnik koji nažalost još uvijek nije dostupan na hrvatskom tržištu. Ova tehnologija trenutačno još uvijek podržava tek relativno jednostavne opcije poput onih za glasovno paljenje i gašenje svjetala te upravljanje bravama na vratima, no Google i Amazon su u više navrata obećali da velika poboljšanja u ovom pogledu slijede već početkom iduće godine.
Tehnologija iza digitalnih asistenata
Svi danas najnapredniji digitalni asistenti su bazirani na tehnologiji u oblaku. Drugim riječima, većina njihovih mogućnosti neće raditi bez veze s Internetom. Posljednje verzije Siri i Cortane doduše koriste lokalne resurse kada je god to moguće, no i dalje od njih ne možete očekivati previše u situacijama u kojima niste povezani na mrežu svih mreža.
Nakon Interneta, svi digitalni asistenti trebaju napredan speech-to-text softver. Analiziranje glasovnog upita je krajnje zeznuta stvar jer i unutar istog jezika postoji bezbroj raznoraznih narječja i dijalekata, kao i homonima, tj. istozvučnica, da ne spominjemo kako ne govore svi korisnici jednakom brzinom.
Kompleksnost problema prepoznavanja glasovnih komandi i analiziranja upita jest glavni razlog zašto osim engleskog današnji digitalni asistenti istinski govore jako mali broj jezika unatoč godinama razvoja. Da, Siri i Google Now podržavaju diktiranje na velikom broju jezika, uključujući i hrvatski, no i dalje ne mogu analizirati upite na većini tih istih jezika.
Upravo je analiziranje ili procesuiranje jezika sljedeći korak na zamršenom putu između vaših glasnica do ekrana pametnog telefona ili kakvog drugog uređaja. Svi postojeći sustavi koriste kombinaciju prepoznavanja ključnih riječi i analiziranja konteksta. I dok je prepoznavanje ključnih riječi lako za shvatiti, kod analiziranja konteksta dolazimo do jako zamršenog područja o kojima proizvođači ne vole pričati, vjerojatno zato što svi paranoično čuvaju svoje napredne algoritme koje koriste njihovi proizvodi.
Dvije činjenice su ipak poznate o ovom koraku. Kao prvo, moderni digitalni asistenti uče vaše obrasce govora i dnevne potrebe ne samo temeljem prijašnjih rezultata korištenja, već i temeljem prijašnjih neuspjelih pokušaja korištenja. Također, ova tehnologija ne uči samo iz korisničkog inputa, već i onog koji im daju njihovi proizvođači, odnosno rastućih baza podataka. Radi se o tzv. “dubinskom učenju” (deep learning) čija upotreba omogućava programima da daju organske odgovore na korisničke upite umjesto da programeri ručno kodiraju svaki odgovor posebno.
Radi se o istoj tehnologiji koja omogućava automatsku kategorizaciju fotografija prema različitim karakteristikama kakvu je nedavno predstavio popularni servis Flickr. Kao rezultat toga, Flickr uočava uzorke u ogromnim količinama podataka koje korisnici uploadaju te posljedično može automatski podijeliti fotografije prema kategorijama kao što su pejzaži, životinje, portreti i sl. Temeljem iste tehnologije Microsoftov Project Adam čiji su dijelovi već aktivni unutar Cortane raspoznaje razliku između fotografija ljudi i životinja te na upit relativno precizno čak može utvrditi i pseće pasmine.
I upravo u deep learningu leži temelj za budući napredak umjetne inteligencije digitalnih asistenata. Kako će developeri razvijati mogućnosti analize novih tipova sadržaja, naši virtualni pomoćnici će sve detaljnije moći analizirati naredbe koje im dajemo i podatke koje im prezentiramo. Gore spomenuti primjer detekcije pasmine bi se npr. lako mogao proširiti na traženje mobitela da “pogleda” vaš obrok kroz kameru pametnog telefona i prezentira vam informacije o nutricionističkim vrijednostima istog. Mogućnosti su doslovno neograničene, no kako digitalni asistenti izgleda nisu samo posljednji trend u svijetu tehnologije te imaju planove dugoročno ostati u našim uređajima, u bliskoj budućnosti im predviđamo dva problema.
Prvi je onaj glasovne detekcije; čak i najnapredniji softver na tržištu i dalje reagira na svačiji glas tako da se nerijetko može neočekivano aktivirati. Drugi je vezan za poslovne modele virtualnih pomoćnika. Kako se radi o softveru koji koristi tehnologiju u čiji su razvoj kroz godine ulupane basnoslovne svote novaca, činjenica da se isti mogu koristiti bez dodatnih naknada znači da uvijek morate pristati na uvjete korištenja u kojima stoji da vas proizvođač softvera može profilirati potrebe ciljanog oglašavanja analizom svog sadržaja kojem njegov digitalni asistent ima pristup.
Tu se, dakle, javlja staro pitanje privatnosti na Internetu s obzirom da se dobrog dijela istog morate odreći ako ćete htjeti uživati u najnovijim tehnološkim dostignućima koja nude Siri, Google Now, Cortana, i sl. Hoće li i kako tehnološka industrija odgovoriti na ova pitanja ostaje za vidjeti.
Siri
Današnji Appleov digitalni asistent je razvijen od strane Siri Inc., tvrtke koju je originalno financirala DARPA, američka agencija za razvoj tehnologija koja radi po narudžbama vojske SAD-a.
Recepcija, može buđenje Postavljanje alarma je jedna od onih radnji koje su bezuvjetno brže putem glasovnih naredbi
Apple je kupio Siri 2010. te već 2011. ponudio Siri na iPhone modelu 4S. Siri je u početku bila manje inteligentna nego što se očekivalo, no današnja verzija je svjetlosnim godinama ispred onoga što smo imali 2011.
Sportski rezultati Jedan od onih tipova upita koji na svim asistentima rade besprijekorno
Siri sada otvara i koristi aplikacije sukladno vašim naredbama, predviđa vaše buduće potrebe i daje proaktivne savjete te nudi diktiranje na nekoliko desetaka različitih jezika, uključujući i hrvatski.
Mrežni problemi Iako proizvođači tvrde da moderni asistenti koriste lokalne resurse kada je god to moguće, dobra veza s Internetom je i dalje preduvjet za kvalitetno korisničko iskustvo
Radi i s velikim brojem aplikacija koje ne razvija Apple, pa tako na zahtjev može identificirati neku pjesmu pomoću Shazama ili locirati vaše Facebook prijatelje. Siri je trenutačno dostupna za iPhone i iPad te će uskoro debitirati na nadolazećem Apple TV-u i CarPlay sustavu.
Ipak nekakva podrška Siri ne prima hrvatske naredbe, no barem joj možete diktirati bilješke na hrvatskom; uz brojne druge kvalitete, Siri je izvrsna i u izbjegavanju pitanja
Google Now
Google Now u svojem postojećem obliku je u biti sinteza nekoliko prijašnjih Googleovih individualnih projekata. Prvenstveno koristi Ok Google glasovnu pretragu i naredbe te Google Now Cards notifikacije.
Google, navini alarm I Google Now bez problema savladava osnovne glasovne naredbe
Google Now je stoga moguće koristiti i bez instalacije svih servisa kojima se služi za ispunjavanje vaših želja, no to mu, naravno, ograničava funkcionalnost. Tako npr. možete koristiti ovaj pomoćnik za brzi pregled vremenske prognoze, jednostavne informacije i rješavanje jednadžbi, no kada pokušate glasovno kreirati podsjetnik Now će vas obavijestiti da morate instalirati dodatne servise.
Vrhunsko diktiranje Google Now pruža daleko najbolje prepoznavanje hrvatskog jezika prilikom diktiranja
Po pitanju third-party integracije, Google Now je najnapredniji digitalni asistent današnjice s podrškom za preko trideset nezavisnih servisa uključujući Lyft, Spotify, TripAdvisor, Airbnb i na desetke drugih. Za razliku od Siri i Cortane, ovaj softver ne pokušava ostaviti dojam stvarne osobe te se nikada ne ponaša kao ništa više nego alat.
Pokušajte ponovno Današnji digitalni asistenti o vama uče ne samo iz uspjelih, već i neuspjelih prijašnjih pretraga
U cijelosti je dostupan na Androidu i iOS-u te Windows i OS X inačicama Chrome preglednika. Windows Phone korisnici također mogu preuzeti Google Now Voice Search, no ne i Google Now Cards koje omogućuju glasovno kreiranje podsjetnika.
Ovo sam ja I dok Siri uči isključivo autonomno, Cortana i Google Now korisnicima daju mogućnost ručnog upisivanja podataka o sebi kako bi ih asistent bolje služio; Google Now i glasom i gestom možete aktivirati s bilo kojeg zaslona na mobitelu; nažalost ne može u stvarnom vremenu prebaciti između engleskih naredbi i diktiranja na hrvatskom
Cortana
Cortana je debitirala na Windowsima 8, no tek je u sklopu Windowsa 10 u potpunosti integrirana u OS. Ovaj program nastoji imitirati ljudskog pomoćnika, a od konkurencije se najviše razlikuje po tome što omogućuje korisnicima kontrolu nad sadržajem i osobnim podacima koje su voljne dijeliti s njim, tj. Microsoftom.
Preglednost Cortanino sučelje je vrlo pregledno na tabletima i desktopima iako ne zauzima cijeli zaslon
Cortana je trenutačno u cjelosti dostupna isključivo na Windows uređajima, no možete je koristiti in a OS X-u pomoću posljednje verzije Parallels VM-a, što je više nego što možemo reći za Appleovu vlastitu Siri. Microsoft je ove godine također najavio planove za izbacivanje Cortana aplikacija na Androidu i iOS-u.
Project Adam Microsoftov posljednji AI sustav je već djelomično zaživio u Cortani, a hvali se naprednim sposobnostima analize raznoraznog sadržaja
Iako niti jedan od tri najpopularnija digitalna asistenta ne razumije naredbe na hrvatskom, Cortana je jedina koja ne podržava čak niti diktiranje na našem jeziku, a ako je želite koristiti na svojem desktop računalu morat ćete u opcijama promijeniti regiju u neku u kojoj je službeno podržana poput SAD-a ili Ujedinjenog Kraljevstva.
Podsjetnici Cortana bez greške barata podsjetnicima s vremenskim i lokacijskim odrednicama; iako niti jedan od popularnih digitalnih asistenata ne razumije hrvatske naredbe, Cortana naš jezik ne može niti prevoditi