MicroBlink i Photomath: Globalni lideri u mobilnoj OCR tehnologiji - 5.0 out of 5 based on 1 vote
MicroBlink i Photomath: Globalni lideri u mobilnoj OCR tehnologiji

MicroBlink i Photomath: Globalni lideri u mobilnoj OCR tehnologiji

Oni mijenjaju način na koji mi koristimo mobitele

MicroBlink i Photomath, vodeće svjetske firme u razvoju OCR (optical character recognition) tehnologije za pametne mobitele, nastale su zbog toga što se jednom čovjeku nije dalo plaćati papirnate račune.

"Prvo smo krenuli raditi tvrtku Racuni.hr, gdje smo radili sustav za slanje elektroničkih računa umjesto papirnatih. To je bila ideja. Krenuo sam to proučavati 2008. i bio je to osobni problem koji sam htio riješiti. Bezveze mi je bilo plaćanje [papirnatih] računa. Dolaze mi računi na papiru i sad ja to moram platiti, prekucavati...", prisjeća se Damir Sabol, osnivač MicroBlinka i Photomatha. Sustav za plaćanje elektroničkih računa razvijali su u suradnji s bankama, a planirali su uzimati proviziju od svakog naplaćenog elektroničkog računa.

U to vrijeme, ni država ni velike firme nisu imale sluha za tu ideju, a ni ostale okolnosti Sabolu nisu išle u prilog. Naime, u to je vrijeme Hrvatska pošta dobila konkurenciju i započeo je rat cijena. Troškovi slanja papirnatih računa drastično su se smanjili. Ipak, to nije pokolebalo Sabola u namjeri da digitalizira plaćanje računa. Jednostavno, odlučio je promotriti problem iz drugog kuta: "Shvatili smo da ljudi vole papirnate račune zato jer ne razumiju elektroničke račune. Kako to, račun je na papiru, nije elektronički. Što je to elektronički račun? Kako to uopće može biti?" No opet, ostalo je pitanje kako spojiti ta dva suprotna svijeta: analogni s papirnatim računima te digitalni s računalom i internetom. Odgovor se cijelo vrijeme skrivao u obliku omanjeg gadgeta, koji je nekoliko godina ranije u isti mah oduševio i razdijelio cjelokupnu tehnološku scenu.

microblink1

SABOLOVE FIRME: zapošljavaju dosta studenata, koji često temu svog diplomskog rada temelje na radu na konkretnim projektima u MicroBlinku i Photomathu

"iPhone se počeo pokazivati kao nešto što će promijeniti svijet. Meni je bilo jasno da će pametni telefoni postati osobni, da će ih zapravo svaki čovjek imati. Imat će velike ekrane, imat će dobre kamere i to mi je bilo dosta jasno. Makar su onda bili skupi. I onda sam mislio, kako mi možemo s tim telefonom riješiti plaćanje računa, a da ne bude komplicirano. I onda sam mislio, idemo mi napraviti tehnologiju koja će ljudima omogućiti da lakše plate račune. Da se skenira račun i da mi prepoznamo sadržaj tog računa i izvadimo podatke za plaćanje. To je bila ideja i onda smo rekli, "Idemo raditi prototip takve tehnologije", Sabol objašnjava eureka moment. Ubrzo im se pridružio Jurica Cerovec, danas tehnički direktor MicroBlinka, a tada nadaren student FER-a.

Slikaj i plati

Za razvoj prototipa aplikacije "Slikaj i plati" trebalo im je šest mjeseci. Uzeli su SDK (software development kit) za mobitele za prepoznavanje znakova svjetski poznate OCR kompanije ABBYY, za prepoznavanje znakova, a implementirali vlastitu tehnologiju za prepoznavanje uplatnice i njenih elemenata. Demo aplikaciju pokazali su, na opće oduševljenje, jednoj od najvećih banaka u Hrvatskoj. "Slikaj i plati" je bilo toliko jednostavno i genijalno rješenje da je oko te funkcionalnosti banka složila cijelu reklamnu kampanju. Ona je postala središnja funkcionalnost njihove aplikacije za mobilno bankarstvo.
Unatoč tome što su od gotovo samih početaka bili profitabilni, nastavili su raditi na usavršavanju tehnologije i pronalaženju novih primjena. Nakon uplatnica, razvili su rješenje za čitanje barkoda, kaže Sabol: "U međuvremenu smo počeli raditi na tehnologiji za čitanje barkoda jer to nismo imali već smo samo čitali tekst s uplatnice. Onda smo napravili skeniranje barkoda, točnije tipa barkoda PDF417 koji se nalazi na hrvatskim uplatnicama. Nije bilo tehnologije koja može čitati tako sitni barkod pa smo odlučili to razvijati dalje.”

sabol2

DAMIR SABOL: ističe kako su uvjeti rada u Hrvatskoj vrlo dobri, no mogli bi biti i bolji. Ovdje imaju problema s pronalaženjem kadra za marketing, nedostatkom ugovora o izbjegavanju dvostrukog poreza s Amerikom, a smatraju i da država može pomoći inovativnim firmama poreznim olakšicama na razvoj R&D projekata

U jednom trenutku shvatili su da nisu potpuno zadovoljni s postojećom OCR tehnologijom koju su koristili na projektima. Bila je spora i predstavljala previše ograničenja. Primjerice, nije mogla raditi na više nego samo na jednoj jezgri mobilnog procesora. I onda su odlučili razviti vlastitu OCR tehnologiju za mobitele. U tom naumu, financijski ih je nemalo potpomognula državna agencija HAMAG-BICRO, koja ih je također podržala u razvoju projekta Racuni.hr. S financijskom potporom, Sabol je mogao zaposliti dva nova inženjera koji su proveli godinu dana na razvoju vlastite OCR tehnologije, koju su naknadno uključili u aplikaciju "Slikaj i plati". Ukupno, trebalo im je dvije godine da razviju vlastitu OCR tehnologiju.

Neočekivan uspjeh Photomatha

Vlastitu OCR tehnologiju danas koriste u različitim rješenjima. Sabol kaže kako nije dovoljno razviti inovativnu tehnologiju, ljudi žele konkretna rješenja za određeni problem. Ovaj način razmišljanja doveo ih je do razvoja Photomatha. "Photomath je počeo tako kad sam ja provjeravao zadaću svom sinu. To mi je bilo dosadno. Onda sam mislio da bi mi možda mogli našu tehnologiju koristiti za rješavanje matematičkih zadataka. Prva ideja je bila da to bude demonstracija naše tehnologije, kao marketing. Uvijek je dobro imati neki živopisni primjer, na kojem ljudi lako shvate što radimo. Stoga smo mi napravili Photomath kao primjer korištenja OCR tehnologije. Mislili smo i da bi to možda mogla biti jako zanimljiva primjena u budućnosti. Ali nismo vjerovali da će to biti toliko popularno. Sad to koriste milijuni ljudi u svijetu. Svaki mjesec oko 6 i nešto milijuna ljudi otvara aplikaciju", govori Sabol.

Osim u Photomathu, koji je danas formalno odvojen od MicroBlinka i na kojem radi zaseban tim (tvrtka), MicroBlink koristi svoju OCR tehnologiju u proizvodima za skeniranje IBAN-a (BlinkIBAN), skeniranje osobnih dokumenata (BlinkID) te skeniranje određenog podatka (BlinkInput). "Zanimljiv primjer na kojem trenutno radimo je skeniranje oznaka u govedarstvu. Goveda na uhu imaju oznaku s registarskim brojem pa se taj broj skenira", Sabol objašnjava jednu primjenu BlinkInputa. BlinkID se pak koristi za skeniranje vozačkih dozvola u Americi, dodaje Sabol: "Spomenuo sam onaj barkod s hrvatskih uplatnica koji smo radili. Ispalo je da se taj barkod nalazi na američkim vozačkim dozvolama. Američke vozačke dozvole su glavni identifikacijski dokument u Americi. I onda smo mi počeli prodavati skener za američke vozačke dozvole." Trenutno rade na rješenju za skeniranje kreditnih kartica, a pokušat će riješiti i problem verifikacije dokumenata na daljinu kamerom mobitela, otkriva nam Sabol: “Pored čitanja podataka želimo omogućiti i verifikaciju. Je li skenirani dokument stvarno autentičan? E, to je tek teško. Ali nije nemoguće. Imamo ideju kako to napraviti."

U MicroBlinku i Photomathu nikad ne nedostaje ideja za unaprjeđenje ili kreiranje novih proizvoda. Stalno im dolaze nove ideje, u razgovoru s klijentima ili u promatranju situacija iz stvarnog svijeta. Međutim, smatraju da je bitna razlika u odnosu na druge firme ta što se oni ne ustručavaju isprobavati te nove ideje. "Mi smo tvrtka koja ima takvu kulturu da se uvijek isprobavaju nove stvari i da će se uvijek isprobavati. Ako treba nešto odlučiti, odlučimo isti dan. Treba li uložiti [novac] u označavanje primjera za Photomath? Mislim da smo tu potrošili pola milijuna kuna. Ali rezultat je tu.", ističe Sabol.

Strojno učenje kao temelj razvoja tehnologije

Strojno učenje, odnosno machine learning postao je nezaobilazan dio razvoja njihove OCR tehnologije. Svi zaposlenici polaze interne edukacije o strojnom učenju, gledaju predavanja i rješavaju zadatke. "Machine learning i konvolucijske neuronske mreže su strašno napredovale u zadnjih nekoliko godina i to zbog nekoliko razloga. Jedan razlog je veliko povećanje računalne snage koju imamo kod računala, i to ne kod procesora nego grafičkog procesora. Zbog te računalne snage znanstvenici su mogli puno više eksperimentirati i dobiveni su vrhunski rezultati. I ono što se događa je da se dijeli znanje. Facebook, Google, Microsoft... Uzeli su najbolje znanstvenike, zaposlili ih i dijele znanje. Besplatno objavljuju i opensourceaju to znanje oko machine learninga. To znači da puno ljudi na svijetu radi na tome i svi dijele znanje i to se strašno širi", govori Sabol te objašanjava kao se to znanje primjenjuje u MicroBlinku i Photomathu: "Machine learning radi tako da se napravi veliki set za učenje i onda se neuronske mreže uče da prepoznaju te specifične stvari.

Ono što treba napraviti je pripremiti podatke. Recimo, za PhotoMath označavaju se matematičke formule odnosno svaki znak u formuli. Na temelju toga dobivamo milijun znakova na kojima učimo mrežu prepoznati svaki od njih. Milijun znakova klasificira se u više od 60 i nešto klasa. Mi smo napravili tehnologiju koja može prepoznavati i rukopis. Ja prije godinu dana nisam vjerovao da to može tako dobro raditi. Ali sad smo apsolutno sve usmjerili u tom smjeru neuronskih mreža." Svaki dan od korisnika Photomatha dobiju oko 300 tisuća slika, odnosno različitih tipova rukopisa koje im koriste kao podaci za strojno učenje.

strojno ucenje

STROJNO UČENJE: koristi se za razvoj i optimizaciju vlastite OCR tehnologije. Podatke za strojno učenje Photomath dobiva od vlastitih korisnika. Trenutno imaju pohranjenih 15-20 milijuna slika zadataka

Za potrebe testiranja i optimizacije tehnologije za izvršavanje neuronskih mreža na mobitelu, Sabol je naručio i sam složio računalo s četiri GTX 1080 kartice. U četiri mjeseca, prepolovili su vrijeme izvršavanja te komponente sa 600 na 300 milisekundi u realnom vremenu. "Ono što očekujem da će se dogoditi i sigurno se već i događa jest da će proizvođači telefona ugraditi specijalne procesore za neuronske mreže. Qualcommov [Snapdragon] 835, koji će se naći u telefonima ove godine, ima DSP procesor koji 8 puta brže izvršava neuronske mreže nego CPU. GPU ih na telefonu izvršava četiri puta, a DSP 8 puta brže, uz puno manju potrošnju energije", kaže Sabol te dodaje da vidi ogroman trend razvoja u tom području: "Sveučilište Oxford i Google DeepMind tim radili su lip syncing, čitanje s usana s videa. Napravili su da [njihovo rješenje] radi četiri puta bolje nego to radi čovjek profesionalac. Samo iz snimke bez zvuka oni mogu reproducirati rečenice četiri puta bolje nego to rade ljudi. Dakle, neke stvari računala sigurno mogu raditi bolje. Machine learning je tu veliki trend i to ćemo ove godine viđati naglašeno."


Od ostalih trendova u budućnosti Sabol smatra kako će AR i VR tehnologije napraviti značajan iskorak, zajedno s umjetnom inteligencijom i tehnologijom za prepoznavanje glasa: "Sad telefon ne može vrtjeti prepoznavanje govora u punoj kvaliteti. Može vrtjeti na serveru, ali [sam] telefon ne može. Međutim, s tim novim procesorima znatno će se povećati mogućnosti. I onda će za prepoznavanje govora on trošiti malo baterije, a govor prepoznavati jako dobro. Što je strateški svima interesantno: Googleu, Appleu, Microsoftu. Tako će se [razvijati] i prepoznavanje objekata. Očekujem da negdje vidiš kako je netko obučen, uzmeš sliku i da [mobitel] prepozna koje odjevne predmete ta osoba ima. Dolazi vrijeme umjetne inteligencije. AI koji razumije što želiš, kako želiš i zna puno bolje isporučiti neku vrijednost korisniku."

50 zaposlenika, 40 milijuna korisnika

MicroBlink ima oko 20, a Photomath oko 15 zaposlenika. Zajedno sa studentima ovdje radi oko 50-ak ljudi. Sva radna snaga se nalazi u Hrvatskoj, usprkos tome što je središte Photomatha formalno registrirano u Americi, a MicroBlink ima podružnicu u Velikoj Britaniji. Photomath je registriran u Delawareu radi investitora, a podružnica MicroBlinka u Londonu osnovana je radi boljeg imidža firme, bolje naplate usluga te ugovora o izbjegavanju dvostrukog oporezivanja s Amerikom.

microblink2

MICROBLINK I PHOTOMATH: njeguju kulturu stalnog isprobavanja novih ideja. Stalno razmišljaju kako napraviti neke nove stvar

MicroBlink svoj poslovni model temelji na prodaji SDK licenci. SDK je dostupan za besplatno testiranje na internetu. Svaka developerska firma ga može skinuti, isprobati te vidjeti zadovoljava li njihove potrebe. Žele li ga koristiti u svom rješenju, moraju platiti licencu. Sabol ističe kako oni ne nude samo tehnologiju već razvijeno korisničko iskustvo (upravljanje kamerom i fokusom kamere). Ovaj se poslovni model pokazao vrlo dobrim, budući da više od 400 tvrtki u više od 40 zemalja licenciraju njihovo rješenje. S druge strane, Photomath se može podičiti s 40 milijuna skidanja na mobilnim platformama, ali oko njega još nisu razvili poslovni model s obzirom da je aplikacija u početku kreirana kao marketinški alat.

MicroBlink tehnologija i Photomath aplikacija olakšale su život brojnim korisnicima pametnih telefona, a naposljetku i Sabolu: "Plaćanje računa je broj jedan stvar na kojoj mi ljudi zahvaljuju. To je broj jedan mogućnost mobilnog bankarstva u Hrvatskoj. I svi su jako zadovoljni. I ja to koristim. I bez toga mi je zapravo, čudno. Ja mrzim upisivati brojke. Čim moraš neki IBAN upisati, katastrofa. U edukaciji, u PhotoMathu, to moja djeca isto koriste. Dobro mi je da vidim što im treba, kako možemo to poboljšati, kako možemo još poboljšati taj edukacijski element, na tome dosta radimo. Mislim da sve to jako olakšava. Ljudi mrze unositi bilo što. Zašto bi unosili? To je bezveze. Čim ti jedanput to probaš, ne ide se natrag."

Ocijeni sadržaj
(1 Glasaj)

Newsletter prijava


Kako izgleda naš posljednji newsletter pogledajte na ovom linku.

Skeniraj QR Code mobitelom i ponesi ovu stranicu sa sobom

MicroBlink i Photomath: Globalni lideri u mobilnoj OCR tehnologiji - VidiLAB - QR Code Friendly