Könnyű helyzetben vagyunk, amikor konkrétumot gépelünk be a keresőbe, például egy bizonyos típusú gépkocsit vagy szolgáltatást szeretnénk igénybe venni, biztosak lehetünk benne, hogy az első találatok között meg fogjuk találni. Ez a magabiztosság viszont elszáll, amint nehezebben megfogalmazható, mire is van szükségünk. Például „abercrombi ruhát hol lehet kapni fehérváron” vagy egy olyan játékot, „amiben a fekete szörny a hegyen szaladgál”, vagy „bányászattal kapcsolatos szólások, közmondások”-at. Ezeket nem én találtam ki, hanem az egyik régi játékokkal foglalkozó blog összegyűjtött legviccesebb keresőkifejezései.
Valóban viccesek? A kontextust nézve igen, viszont rávilágít egy tényre: sokan úgy keresnek, ahogy gondolkoznak. Sajnos a keresők itt megbuknak a vizsgán, hiszen a fent említett három kifejezésből kettőre teljesen rossz helyre irányította az illetőt. Miért van ez, miért kell nekünk alkalmazkodni a technológiához, amikor olyan találmányok vesznek körül minket, mint a három dimenziós televízió, az átlátszó álcázás, vagy az IBM szuperszámítógépe, ami legyőzte az egyik műveltségi vetélkedő két legsikeresebb játékosát?
A választ az internetes adattárolás nyelvében, a HTML-ben kell keresnünk: csak minimális többletinformációt hordoz a segítségével megjelenített szövegekről és adatokról, így, ha jelenlegi állapotában fel szeretnénk azokat dolgozni, szükség is lenne az előző bekezdésben említett szuperszámítógépre.
Ha a szövegeket már megértenék a gépek, jobban állnánk, de felvetődik a következő probléma: a megjelenő szövegek és adatok közti összefüggések. Az egyik legegyszerűbb példa erre egy blogbejegyzés, aminek van címe, bevezetője, szövegtörzse, szerzője. Ha egy ember ránéz, ezeket elsőre felismeri, de arra újabb mesterséges intelligenciát kell kifejleszteni, hogy gépileg is fel lehessen ezeket térképezni.
Történtek már kezdeményezések az internetes oldalakon található tartalmak jelentésének megjelölésére, lásd például a mikroformátumokat. Viszont azt kéne felismernie minden webes fejlesztőnek, hogy a HTML alapvetően csak adatmegjelenítésre alkalmas, főleg a legújabb változata, az 5.0, mivel 1, rengeteg (fölösleges) információt tartalmaz az adatok megjelenítésének kinézetével kapcsolatban, 2, az összetartozó adatok közötti összefüggéseket nem tárolja.
Tehát két választási lehetőségünk van, ha pontosabb találatokat szeretnénk kapni. Az első az, hogy óriási összegeket költünk olyan mesterséges intelligencia kifejlesztésére, ami a meglévő internetes tartalomban felismeri a szövegek és adatok jelentését, valamint a köztük lévő összefüggéseket. Ezt nyilvánvalóan csak olyan tőkeerős cégek tudják megengedni maguknak, mint például a Google vagy a Microsoft, viszont annak beláthatatlan következményei lehetnek, ha így magánkézbe kerül az internet jövője.
Erre egy alternatíva lehet az, hogy első körben megváltoztatjuk az internetes adattárolás nyelvét egy olyanra, ahol a megjelenítendő információkat elválasztjuk a megjelenítési formájuktól, azaz a fenti példával élve külön tároljuk egy blogbejegyzés címét, szerzőjét, tartalmát a grafikai reprezentációjától. Ezáltal létrejönnek olyan objektumok, amelyeket egységesen lehet kezelni, mert ugyanolyan tulajdonságaik vannak.
Második körben létre kell hoznunk egy olyan központi adatbázist, amiben a világot leíró objektumok közti kapcsolatokat tároljuk, például egy objektum a blogbejegyzés, és annak gyermek objektumai a hozzá kapcsolódó hozzászólások és így tovább. Ilyen módon legalább egy mesterséges intelligencia kifejlesztését megspórolhatjuk, valamint a nyílt technológiával biztosítjuk az internetes társadalmat a magáncégek visszaéléseitől.
A jó hír az, hogy a vázolt alternatíva megvalósítható már létező technológiákkal, a rossz hír viszont az, hogy rengeteg munkát igényel. Előbb-utóbb viszont meg kell lépni, és ha azt szeretnénk, hogy az internetet hatékonyan használhassuk arra, amire kitalálták, azaz információátadásra, célszerű minél előbb belevágni.