Web-ul semantic sau gînditorul din computer

2 februarie 2008 MASS COMEDIA

Practic, ar fi vorba de un web inteligent şi relevant, în care computerele devin capabile să înţeleagă sensul unui text, să nu se limiteze doar la combinarea termenilor, să facă diverse conexiuni, să găsească sinonime şi să se lege doar de aspectul formal. Nova Spivack, un entuziast al web-ului semantic, care a început deja să dezvolte aplicaţii în acest sens, vorbea despre el în termenii unui set de tehnologii care fac posibilă o nouă viziune asupra Internetului, "un viitor în care toată cunoaşterea există pe web într-o formă pe care aplicaţiile software o pot înţelege şi la care pot reacţiona". Sînt două direcţii prin care web-ul semantic s-ar putea dezvolta - spun entuziaştii ideii. Una ar fi crearea de programe software inteligente care să fie capabile să analizeze paginile web în forma lor actuală, agenţi antrenaţi să extragă sensul şi să stabilească relaţii între informaţii aflate în locuri diferite pe web, pentru a face căutarea unei teme relevantă. Un agent software este practic un asistent care învaţă din acţiunile comandate şi care poate fi antrenat să înţeleagă anumite cerinţe. Dacă i-am spus o dată că William Shakespeare a scris Hamlet, va şti acest lucru şi îl va folosi în continuare. Va înţelege că Shakespeare este o persoană, un autor, şi că Hamlet este opera sa. Dacă îl învăţ apoi că Hamlet şi Macbeth sînt scrise de acelaşi autor, va şti, prin analogie, că este vorba de Shakespeare. Şi aşa mai departe. Cine va antrena aceşti agenţi - s-a pus întrebarea - cine va învăţa computerul, ca pe un copil, ce e un verb, ce e un substantiv, care e structura sintactică a unei fraze şi, mai ales, cum să înţeleagă despre ce e vorba? Odată software-ul creat, spunea Nova Spivack, toţi aceşti oameni care acum depun un efort uriaş pentru a crea pagini pe Wikipedia vor putea face asta. A doua direcţie ar fi scrierea paginilor web într-un limbaj specific, un HTML semantic, care ar defini de la început foarte bine termenii. În codul de scriere al unei pagini web ar trebui să existe tag-uri specifice pentru a defini un element, metadate care să-l descrie exact; de exemplu, cînd este vorba despre o carte, să se marcheze tehnic titlul, autorul, subiectul, eventual ideile principale, pentru a-i fi uşor apoi unui motor de căutare semantic să găsească informaţiile cerute. Deşi poate mai eficientă, această soluţie pare imposibilă ţinînd cont de numărul enorm de pagini web existente, care ar trebui modificate şi este greu de crezut că toată lumea va accepta noile protocoale în creare a site-urilor. La ce foloseşte Web-ul semantic se construieşte pe ontologii, iar ontologia, în înţelesul pe care i-l dă tehnologia informaţiei, este o structură, un model care defineşte conceptele dintr-un anumit domeniu, legăturile dintre ele, termenii specifici, funcţiile şi regulile. Pe baza acestui model, computerul înţelege domeniul respectiv, face conexiuni şi oferă soluţii. La ce foloseşte? De exemplu, îi spun computerului că am nevoie să cumpăr o carte despre un anumit subiect, de la o librărie care să se afle în apropierea casei mele, deschisă sîmbăta, iar preţul respectivei cărţi să nu depăşească o anumită sumă. În plus, îi dau o listă de autori care au scris despre această temă, unde marchez priorităţile. Computerul înţelege ceea ce vreau, face conexiunile necesare între elementele cerinţei mele, reduce aria librăriilor de cercetat, se conectează automat la computerele lor, vede care dintre ele e deschisă, îmi caută cartea după subiect (chiar dacă acesta nu apare explicit în titlu) şi vede dacă preţul e cel cerut de mine. În final, îmi prezintă o listă relevantă de opţiuni. Internetul tinde să se transforme într-o imensă bază de date, iar web-ul semantic pare soluţia pentru a face ordine în acest haos informaţional. Un studiu al Universităţii din California spune că mai mult de jumătate dintre utilizatori nu au încredere în relevanţa rezultatelor motoarelor de căutare şi că nu au siguranţa că informaţiile găsite sînt autentice. Acest lucru se întîmplă pentru că motoarele de căutare găsesc combinaţiile formale de cuvinte doar la nivel lexical, fără a înţelege ce le ceri de fapt. Tocmai de aceea, găsim nu de puţine ori termenii căutaţi disparaţi într-o pagină web, fără legătură între ei şi fără să fie de fapt structura cerută. Să fie web-ul semantic sfîrşitul tuturor frustrărilor noastre legate de viaţa online, atunci cînd ajungem pe site-uri ciudate căutînd cine ştie ce şi dăm peste cu totul altceva? Este greu de spus, mai ales că în stadiul actual un web inteligent pare o utopie care ţine de literatură. Dificultăţi sînt multe, în afara tehnologiilor complicate care ar trebui adoptate pe scară largă şi transformate în standarde, baza acestui sistem este limba, iar limba este un organism dinamic, viu, construcţiile sînt variabile şi de multe ori sensul stă în subtilitate sau în ironie. Este greu de crezut că va ajunge computerul să sesizeze umorul, dar nimeni nu-i cere, cel puţin acum, să citească printre rînduri sau să explice bancuri. Este vorba momentan de a ne face nouă, utilizatorilor, viaţa mai frumoasă şi căutările, şi cercetarea mai eficiente, prin informaţie structurată. Despre web 3.0 se spune că va fi un web 2.0 cu creier. Structurile deja existente vor fi standardizate şi aplicaţiile vor putea comunica între ele prin interfeţe deschise, astfel încît computerul meu să îmi poată face programare la medic, să îmi caute o reţetă sau să îmi dea o informaţie relevantă într-un domeniu. Deja au apărut aplicaţii, cum sînt twine, swoogle, mozilla operator, ontoworld sau adaptive blue, care testează principiile web-ului semantic, se antrenează pentru a înţelege documentele şi a organiza informaţia. Dacă avem încredere în ceea ce spun cercetătorii conceptului, în cîţiva ani web-ul semantic va intra încet-încet în computerele noastre.