HTML

Szemantikus web

A HTML alapú web elérkezett a határaihoz, itt az ideje a technológiai és szemléletváltásnak! A blogban megjelent írások szerzője Hidvégi Gábor, a bemutatott ötletek és megoldások jogtulajdonosa.

Friss topikok

  • fodor balazs: Az XSLT tényleg egy okos állatfaj, csak elég kevés esélyt látok az elterjedésére én is. Ehelyett i... (2011.03.19. 20:13) Szemantika a HTML-ben
  • Hidvégi Gábor: @arsen: az Apple-t a saját érdekei vezérlik, például a HTML5-öt azért favorizálja, mert nagyobb ko... (2011.03.16. 23:39) Mire van szükségünk HTML 5 helyett?
  • Hidvégi Gábor: @hrgy: az oda-vissza gombok használata résztartalom-váltás esetén azért is problémás, mivel a docu... (2011.03.15. 22:11) A HTML oldalak gyorstárazása

A kapcsolatok hiánya

2011.02.24. 18:30 Hidvégi Gábor

Könnyű helyzetben vagyunk, amikor konkrétumot gépelünk be a keresőbe, például egy bizonyos típusú gépkocsit vagy szolgáltatást szeretnénk igénybe venni, biztosak lehetünk benne, hogy az első találatok között meg fogjuk találni. Ez a magabiztosság viszont elszáll, amint nehezebben megfogalmazható, mire is van szükségünk. Például „abercrombi ruhát hol lehet kapni fehérváron” vagy egy olyan játékot, „amiben a fekete szörny a hegyen szaladgál”, vagy „bányászattal kapcsolatos szólások, közmondások”-at. Ezeket nem én találtam ki, hanem az egyik régi játékokkal foglalkozó blog összegyűjtött legviccesebb keresőkifejezései.

Valóban viccesek? A kontextust nézve igen, viszont rávilágít egy tényre: sokan úgy keresnek, ahogy gondolkoznak. Sajnos a keresők itt megbuknak a vizsgán, hiszen a fent említett három kifejezésből kettőre teljesen rossz helyre irányította az illetőt. Miért van ez, miért kell nekünk alkalmazkodni a technológiához, amikor olyan találmányok vesznek körül minket, mint a három dimenziós televízió, az átlátszó álcázás, vagy az IBM szuperszámítógépe, ami legyőzte az egyik műveltségi vetélkedő két legsikeresebb játékosát?

A választ az internetes adattárolás nyelvében, a HTML-ben kell keresnünk: csak minimális többletinformációt hordoz a segítségével megjelenített szövegekről és adatokról, így, ha jelenlegi állapotában fel szeretnénk azokat dolgozni, szükség is lenne az előző bekezdésben említett szuperszámítógépre.

Ha a szövegeket már megértenék a gépek, jobban állnánk, de felvetődik a következő probléma: a megjelenő szövegek és adatok közti összefüggések. Az egyik legegyszerűbb példa erre egy blogbejegyzés, aminek van címe, bevezetője, szövegtörzse, szerzője. Ha egy ember ránéz, ezeket elsőre felismeri, de arra újabb mesterséges intelligenciát kell kifejleszteni, hogy gépileg is fel lehessen ezeket térképezni.

Történtek már kezdeményezések az internetes oldalakon található tartalmak jelentésének megjelölésére, lásd például a mikroformátumokat. Viszont azt kéne felismernie minden webes fejlesztőnek, hogy a HTML alapvetően csak adatmegjelenítésre alkalmas, főleg a legújabb változata, az 5.0, mivel 1, rengeteg (fölösleges) információt tartalmaz az adatok megjelenítésének kinézetével kapcsolatban, 2, az összetartozó adatok közötti összefüggéseket nem tárolja.

Tehát két választási lehetőségünk van, ha pontosabb találatokat szeretnénk kapni. Az első az, hogy óriási összegeket költünk olyan mesterséges intelligencia kifejlesztésére, ami a meglévő internetes tartalomban felismeri a szövegek és adatok jelentését, valamint a köztük lévő összefüggéseket. Ezt nyilvánvalóan csak olyan tőkeerős cégek tudják megengedni maguknak, mint például a Google vagy a Microsoft, viszont annak beláthatatlan következményei lehetnek, ha így magánkézbe kerül az internet jövője.

Erre egy alternatíva lehet az, hogy első körben megváltoztatjuk az internetes adattárolás nyelvét egy olyanra, ahol a megjelenítendő információkat elválasztjuk a megjelenítési formájuktól, azaz a fenti példával élve külön tároljuk egy blogbejegyzés címét, szerzőjét, tartalmát a grafikai reprezentációjától. Ezáltal létrejönnek olyan objektumok, amelyeket egységesen lehet kezelni, mert ugyanolyan tulajdonságaik vannak.

Második körben létre kell hoznunk egy olyan központi adatbázist, amiben a világot leíró objektumok közti kapcsolatokat tároljuk, például egy objektum a blogbejegyzés, és annak gyermek objektumai a hozzá kapcsolódó hozzászólások és így tovább. Ilyen módon legalább egy mesterséges intelligencia kifejlesztését megspórolhatjuk, valamint a nyílt technológiával biztosítjuk az internetes társadalmat a magáncégek visszaéléseitől.

A jó hír az, hogy a vázolt alternatíva megvalósítható már létező technológiákkal, a rossz hír viszont az, hogy rengeteg munkát igényel. Előbb-utóbb viszont meg kell lépni, és ha azt szeretnénk, hogy az internetet hatékonyan használhassuk arra, amire kitalálták, azaz információátadásra, célszerű minél előbb belevágni.

Szólj hozzá!

A bejegyzés trackback címe:

https://szemantikus.blog.hu/api/trackback/id/tr462688073

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.