Nismo roboti!

Uskoro ćemo se osloboditi rešavanja obaveznog testa kojim dokazujemo da nismo robot. CAPTCHA provera za pristup Web sadržajima ume da bude zamršena, nervira korisnika i troši njegovo vreme. Za njeno prevazilaženje pobrinuće se najpoznatije ime Internet sveta – Google.

Potvrdni kod CAPTCHA dobio je ime kao skraćenica izraza Completely Automated Public Turing test to tell Computers and Humans Apart (potpuno automatizovani, javni Turing‑ov test za razlikovanje računara i ljudi). Naziv je smišljen 2000. godine na Univerzitetu Karnegi Melon (CMU), a autori su Luis Van Ahn, Manuel Blum, Nicholas J. Hopper (svi sa CMU‑a) i John Langford (tada iz IBM‑a).

Svakodnevno se rešavaju milioni CAPTCHA zadataka. Ovi potvrdni kodovi veoma su bitni za Web programere zbog prevencije sajtova od napada malicioznih botova. Razlozi su višestruki: botovi oglašavača koji obasipaju Internet sajtove reklamnim porukama, samootvaranje naloga na sajtovima sa besplatnim uslugama, zaštita korisničkih naloga od krađe identiteta, sprečavanje pristupa besplatnim sajtovima za razmenu datoteka, spam…

Tokom provere računar traži od korisnika da reši jednostavan test. Zadatak je tako osmišljen da računar može da ga kreira i oceni tačnost odgovora, ali sam nije sposoban da ga reši, tako da se svaki korisnik koji unese tačan odgovor smatra čovekom. Uobičajeni CAPTCHA kodovi traže od korisnika da unesu nekoliko slova ili brojeva prikazanih na iskrivljenoj slici, a uveden je i zvučni CAPTCHA zbog slepih i slabovidih korisnika.

reCAPTCHA

Pored doprinosa koji je dao u raznim segmentima informacionih tehnologija, Google se aktivno uključio u razvoj besplatnog servisa koji štiti Web sajtove od spama i zloupotreba druge vrste. Njegov servis naziva se reCAPTCHA. Google je kupio ovaj sistem 2009. ne samo da bi onemogućio aktivnosti spamera i botova, već i radi rešavanja drugih problema u svom poslovanju.

Sistem reCAPTCHA nudi mnogo više od zaštite od spama. Koristi se za automatsku digitalizaciju ogromnog broja skeniranih knjiga koje Google ima u svojoj bazi (biblioteka Google‑ovih knjiga). Skenirane reči prevode se u digitalni tekst korišćenjem OCR (Optical Character Recognition) softvera za prepoznavanje teksta, a zatim se reCAPTCHA sistemom proverava validnost prevoda. U tom cilju, umesto potvrdnog koda s besmislenim rečima ili kombinacijama slova i brojeva pojavljuju se reči iz skeniranih knjiga. Kad više ljudi za istu reč da isti odgovor, sistem smatra da je reč pogođena i sklanja je sa spiska.

Svaki put kada je reCAPTCHA rešen, korisnici pomažu računaru da nauči da prepoznaje nove pojmove i oblike. Kada reCAPTCHA traži od vas da u vizuelnoj slagalici identifikujete saobraćajne znake, automobile ili neku životinju, vi pomažete Google‑ovim algoritmima mašinskog učenja da shvate kako izgleda saobraćajni znak, automobil ili prikazana životinja. Ista tehnologija pomaže Google‑u da identifikuje teške reči kada digitalizuje knjige i da određuje adrese pri snimanju za Google mape.

Pre nekoliko godina (2014), Google je pojednostavio proveru validnosti korisnika. Omogućio je da se autentifikacija obavlja, za razliku od kompletnog ispisivanja uvrnutih karaktera ili rešavanja matematičkih problema, jednostavnim klikom na opciju I’m not a bot. Taj sistem zove se No CAPTCHA reCAPTCHA. Dovoljno je samo da se klikne na opciju I’m not a bot ukoliko je korisnik logovan na Google nalog, a u slučaju da nije, pojavljuje se vizuelna slagalica.

Nevidljivi reCAPTCHA

Novi korak u pojednostavljenju je nevidljivi reCAPTCHA. Početkom marta ove godine Google je, nakon testiranja sistema u trajanju od tri meseca (od decembra 2016), lansirao Invisible reCAPTCHA, koji će biti u stanju da razlikuje botove od ljudskih bića ne zahtevajući pritom nikakvu dodatnu aktivnost korisnika. To je značajan napredak u odnosu na dosadašnje CAPTCHA i reCAPTCHA sisteme, s obzirom na to da nudi mnogo jednostavniji pristup validnim korisnicima i zaustavlja botove. Korisnik treba da rešava CAPTCHA zadatke samo kad je njegovo ponašanje iz nekih razloga sumnjivo.

Jedan od važnih razloga za prelazak na ovakav (nevidljiv) sistem jeste činjenica da se sve veći broj korisnika služi mobilnim uređajima na kojima je teže prikazati kod za CAPTCHA proveru. Invisible reCAPTCHA može ravnopravno da se koristi i na desktop računarima i na mobilnim uređajima.

Prema Google‑u, nova tehnologija koristi algoritam mašinskog učenja s naprednom analizom ponašanja korisnika tokom pretraživanja Interneta. Analiza se radi na osnovu brzine kucanja i skrolovanja, lokalno sačuvanih „kolačića“, statusa o logovanju, Web pretraživanja i drugih detalja Google‑ovih zapisa o svakom korisniku.

U tekstu developers.google.com/recaptcha/docs/invisible, Google daje precizno objašnjenje Web programerima kako da se Invisible reCAPTCHA sistem implementira i podesi na Web sajtu. Ponuđena su tri načina. Najjednostavniji je automatsko vezivanje za HTML kod, pri čemu se Java Script koristi, a HTML‑u dodaje nekoliko atributa (class name, sitekey, callback). Složeniji načini podrazumevaju nešto više nivoe programiranja, ali je rezultat isti.

Nadežda Veljković

(Objavljeno u PC#244)