Veštačka inteligencija i njen institut
Srbija osniva državni institut za veštačku inteligenciju. Zvuči moderno, naučno i vizionarski. Ali bojim se da je upravo taj pozitivan prizvuk glavni razlog za osnivanje još jednog državnog instituta.
Veštačka inteligencija je, naime, korisna stvar već sada i biće još važnija nadalje. Nema sumnje da će i domaće firme tu nešto doprineti i da će se aspekti veštačke inteligencije sve više koristiti u Srbiji, u državnom i privatnom sektoru. Ali veštačka inteligencija danas nije fundamentalna i nekomercijalna naučna oblast za kakve je potrebno državno finansiranje. Ona ne generiše posebno transferabilno znanje u smislu da će državni institut razviti nešto što će se koristiti u široj domaćoj privredi. Veštačka inteligencija kakva danas postoji je jedna visoko primenjena aktivnost, koja ima smisla jedino u konkretnim firmama i na konkretnim zadacima. Država tu nema šta da traži.
Sam termin „veštačka inteligencija“ stvara dosta magle i ne pomaže razumevanju šta ova stvar danas predstavlja i čemu služi. Kao koncept i kao oblast istraživanja, veštačka inteligencija nastala je sa idejom da mašine jednog dana zaista razviju inteligenciju sličnu ljudskoj. Sve je počelo negde 1950-ih, na osnovama koje su postavili neki od najvećih umova 20. veka: Alan Turing, John von Neumann i drugi koji su van same oblasti manje poznati od ove dvojice.
Njihov cilj bio je razvoj opšte inteligencije na osnovama logike. Ako bi se inteligencija razvila iz početnih principa onda bi se mašine jednog dana mogle stvarno naučiti da razmišljaju. To bi vodilo stvaranju opšteg tipa inteligencije, nalik onoj koju imaju ljudi.
Ovakvi pokušaji trajali su nekih pola veka i nisu daleko stigli. Dostignuća su bila skromna. Možete razviti neki sistem govora, čitanja ili prevođenja na bazi jezičkih pravila i rečnika, ali su sistemi razvijeni na taj način ipak ostajali primitivni. Kompjuter može operisati u nekom zatvorenom sistemu pravila, igrati tablić ili šah, ali stvoriti inteligenciju koja će biti funkcionalna u realnom svetu ispostavilo se mnogo težim. Ljudska inteligencija je ekstremno komplikovana stvar i pokušaji da se ona prenese na kompjutere nisu daleko dogurali.
Sve to vreme, osim dominantnog, „logičkog“ pristupa razvoju inteligencije postojao je i jedan manje uticajni, „empirijski“ pristup nekolicine istraživača. Možda kompjuter i ne moramo učiti da razmišlja sistematski i logički. Možda je dovoljno pokazati mu veliki broj primera tako da on iz njih, na bazi indukcije, izvuče neko pravilo koje se može primeniti na nove situacije.
Onda se, u poslednje dve decenije, dogodilo nešto revolucionarno. Internet je počeo da generiše ogromne količine podataka. Empirijski pristup veštačkoj inteligenciji koji nije imao previše pristalica, niti neke rezultate, izbio je u prvi plan. Odjednom smo se našli u moru svakojakih podataka, a računarska snaga je u međuvremenu narasla do neslućenih visina.
To je promenilo samu definiciju veštačke inteligencije. Umesto ranijih napora na razvoju opšte inteligencije, danas možemo uzeti ogromne količine podataka, iz njih indukcijom izvući neke zaključke, a onda te zaključke primeniti na buduće slučajeve.
Problem tako postaje mnogo lakši. Više se ne pokušava razviti opšta inteligencija, već se koriste podaci da bi se rešio konkretan problem. Tako nešto smo, u suštini, mogli raditi i ranije i to se zvalo statistika. Ali sada imamo ogromnu količinu podataka, što nam omogućava da uposlimo ogroman broj varijabli i ispitamo razne moguće korelacije između različitih stvari. Na taj način možemo, skoro iz mraka, bez ikakvog prethodnog znanja, doći do zaključaka o mogućoj povezanosti različitih pojava. Na tome je u poslednjih 15-ak godina izgrađena savremena verzija veštačke inteligencije.
Klasičan primer novog pristupa je filter za razdvajanje e-mailova na loše (Spam) i dobre koji idu u Inbox. Ako uzmete milion e-mailova, vidite koje su korisnici stavili u Spam i koje nisu, pa onda izdvojite ključne reči karakteristične za e-mailove koji odlaze u Spam („popust“, „povoljno“, „nigerijski princ“, itd.), vi možete razviti sistem koji na osnovu tih reči prepoznaje spam u budućim e-mailovima i pravilno ih klasifikuje. Tako ste dobili automatski filter.
Spam filter je jednostavna i jedna od prvih primena moderne veštačke inteligencije, ali je dobar primer jer se iz njega vide neke važne stvari.
Prvo, ovde se radi o običnom statističkom modelu. Imamo binarnu zavisnu varijablu (spam ili ne) i mnogo nezavisnih varijabli (mnogo mogućih ključnih reči i druge osobine e-mailova). Spam filter je statistički model koji na osnovu sadržaja e-maila ocenjuje verovatnoću da je on spam ili ne i tako ih klasifikuje. To radi sa određenom greškom, neki dobri emailovi odu u spam, neki spam se provuče u inbox, ali se vremenom, uz sve više podataka, model usavršava.
Gro onoga što se naziva veštačkom inteligencijom danas se zasniva na statističkim metodima, najčešće upravo ovakvim klasifikacijama na osnovu velikog broja drugih varijabli. Te metode se zajednički zovu „mašinsko učenje“ ili u poslednje vreme sve više „duboko učenje“, što je još jedna podgrupa metoda. Zovu se učenjem jer se statistički model formira iz prethodnih podataka (u žargonu, „trenira se“ ili uči iz njih), a onda proverava i primenjuje na novim slučajevima. To se može raditi sa milionima ili mijilardama opservacija i hiljadama varijabli, ali suštinski je to i dalje vrsta statističke analize.
Drugo, vidite da su ovi procesi dosta daleko od nekadašnjeg ideala da se dođe do veštačke inteligencije nalik ljudskoj. Spam filter je relativno jednostavan model koji dobro radi jer ima mnogo podataka. Ali i složenije aplikacije kao što su automatizovani govor, chat botovi koji odgovaraju na pitanja mušterija, Googleov prevodilac, prepoznavanje slika i samovozeći automobili, rade na istom principu. Iza njihovog uspeha stoji sirova snaga. Za sve važi da se ne oslanjaju na bilo kakvu imitaciju misaonog procesa, već na ogromne količine podataka iz kojih uče. Sadašnji sistemi za prevođenje nisu bolji zato što su savladali jezička pravila, već zato što su u njih ubačeni milioni fraza i rečenica koje su oni obradili i na osnovu toga prevode nove fraze koje ubacite u Google Translate. Sada su i gramatički vrlo dobri, ali to nije zbog boljeg razumevanja jer i dalje nemaju nikakvo.
Treće, baš zato što se ne radi o opštijoj inteligenciji već o statističkim uvidima za rešavanje konkretnih problema, današnje aplikacije veštačke inteligencije optimizovane su za domene u kojima nastaju. Finansijska aplikacija za procenu naplativosti kredita razvijena u Srbiji neće biti uspešna u Mađarskoj, već je potrebno razviti sasvim novi sistem, iz novih podataka i sve vreme ga održavati i unapređivati kroz vreme jer se i okolnosti na istom mestu menjaju. Samovozeći automobili razvijeni na podacima iz jednog grada imaju problem da se snađu u drugom. Zato je veštačka inteligencija danas jako uska i konkretna. Uvek je vezana za neku specifičnu primenu, u nekom mestu, u neko vreme.
Moguće je da je veštačka inteligencija na vrhu svog hajpa i da će dalji progres biti sporiji nego što se mislilo. Samovozeći autmobili, na primer, mogu se već sada proglasiti razočaranjem jer ima već deset godina otkad su bombastično najavljeni. I upravo se ova specifičnost današnje veštačke inteligencije, njena zavisnost od konkretnih podataka kojima se hrani, navodi kao glavno ograničenje. Baš zato automobili mogu sami da voze u jednostavnom okruženju, na autoputu, ali se u gradovima, u manje tipičnom i manje strukturisanom okruženju, lako zbune.
Iz istih razloga, i važnije za naše svrhe ovde, oblast veštačke inteligencije je danas daleko od fundamentalnih istraživanja. Ona je odavno prestala biti mitološka potraga za Svetim gralom vanljudske, robotske inteligencije, frankeštajnovski mit 20. veka, i postala jedna krajnje praktična oblast. Tu se vrlo malo radi o apstraktnim istraživanjima, a mnogo više o upošljavanju konkretnih podataka i poznatih statističkih metoda, za ispunjavanje konkretnih zadataka.
Od države se može tražiti da podrži neki deo nauke koji je važan u osnovi ali nema primenu. Ali današnja veštačka inteligencija je u drugoj krajnosti. Potraga za nekim teorijskim fundamentima je tu davno obustavljena. Sada imamo samo jednu sasvim primenjenu i komercijalnu aktivnost. Lideri veštačke inteligencije u svetu su firme džinovi sa mnogo podataka, od Googlea do Alibabe, a tu su i manje firme koje pronalaze dobre načine da iskoriste podatke. Sve je to jedna privatna, dinamična i profitna aktivnost. Države se tu pojavljuju kao korisnici (ponekad veliki korisnici, najviše Kina), ali retko ili nikad sa nekakvim cutting-edge institucijama koje će navodno davati neki originalni doprinos.
Domaće firme bi mogle lepo da se uključe u ovu oblast i neke već jesu. Ali šta bi jedan državni institut tu radio, meni nije jasno. Niti mi je išta jasnije iz StartItovog intervjua sa izabranim rukovodiocima Instituta.
To nije ni obrazovna institucija, ni tržišna, ni strogo naučna. Kažu, na primer:
“To je od države podržan startap.”
Ali to nije “od države podržan startap”, nego klasična državna institucija.
“U ovom trenutku deluje kao najteži aspekt naći adekvatan kadar, odnosno prve istraživače.”
Ovaj deo je jasan. Naravno da je državi teško pronači kadrove iz jedne eminentno komercijalne branše. Neće dobiti najbolje među njima.
Onda će tu biti neki mentorski program, gde će naučnici pomagati:
“… od izbora oblasti istraživanja, preko objavljivanja radova u relevantnim publikacijama, pa do toga da osmislimo nove projekte i osvojimo finansiranje od različitih fondova.”
Sada ovo izgleda kao da se radi o naučnoj instituciji, o CERN-u kojem trebaju fondovi, a ne izrazito primenjena i komercijalna struka.
“Kako Kisačanin kaže, jedan od glavnih aduta kojima Institut privlači talente je baš to što će moći da u njemu puno nauče i posle dve-tri godine požele da osnuju svoje kompanije ili pređu na univerzitete ili postojeće firme.”
Lepo od njih, ali zašto o trošku poreskih obveznika?
Malo zabune oko toga šta je danas veštačka inteligencija, malo pomodarstva, malo lobiranja i interesa i ispostavljen nam je račun za još jednu instituciju koja možda neće mnogo koštati, ali će još manje doprineti.