Ungváry Rudolf (OSZK)

 

Információkereső tezauruszok és az ETO kompatibilitási kérdései

Tezaurusz és ETO megfeleltetése.

 

A könyvtári rendszerek on-line forradalma után mind a hagyományos osztályozási rendszerek (köztük a Tizedes Osztályozás és az ETO), mind pedig az információkereső tezauruszok megőrizték vezető szerepüket a tartalmi feltárás is információkeresés területén. A legtöbb jelentős könyvtárban egyformán használják mindkét típusú rendező rendszert, melyek ma már a nyilvános on-line katalógusok felületén is elérhetők.

A kétfajta rendező rendszer párhuzamos használatának alapja, hogy velük teljesen eltérő módon játszódik le a tartalmi feltárás és a tartalom szerinti keresés. Az osztályozási rendszerekkel általában nagyfokú teljesség, az információkereső nyelvekkel pedig nagyobb pontosság biztosítható. A hatékony keresés a két fajta rendszer kombinációjával biztosítható.

Mindebből egyrészt következik, hogy a két rendszer között nincs ekvivalens leképzés, e két rendszer nem kompatíbilis. Egy osztályozási jelzettel megadott találati halmaz elvileg mindig eltér attól a találati halmaztól, melyet e jelzet magyarázatát alkotó természetes nyelvű kifejezéssel végzett kereséskor kapunk. Az előbbi ugyanis osztályt, az utóbbi azonban csak osztály ismérvét alkotja.

Mindebből nem következik, hogy nincs semmiféle kapcsolat a két fajta rendező rendszer között, hanem az, hogy ez a kapcsolat az eleme-összessége reláción alapszik. Egy-egy természetes nyelvű kifejezés egyszerre több osztály ismérve is lehet, és egy-egy osztályt egynél több természetes nyelvű kifejezés jellemezhet ismérvéként.

Az egyetemes, átfogó tezauruszok megjelenésével az ugyancsak átfogó osztályozási rendszerek közötti kapcsolódás megteremtése is időszerűvé vált. A felhasználót a leginkább az támogatja, ha a tezauruszok lexikai egységei mellett feltüntetik azokat az osztályozási jelzeteket, melyeknek e lexikai egységek az ismérvei. A lexikai egységek mint mutatószavak és az osztályozási jelzetek közötti kapcsolatok számos speciális problémát vetnek fel.

Az egyik legfontosabb probléma a homonimák és poliszémák kezelése: ugyanaz a kifejezés egyszerre több osztály ismérve lehet, a kifejezés tehát más-más szempontból mást és mást jelenthet.

A másik fontos problémát az jelenti, hogy nem minden osztályhoz állapítható meg egyszer formában természetes nyelvű mutatószó.

E két alapvető kérdés megoldásához a lexikai egységeknek a tezauruszokra hagyományosan jellemző szerkezeti elvein is változtatni kell. Többek között azzal, hogy adott esetben nemdeszkriptorhoz is kapcsolódhat osztályozási jelzet (holott nemdeszkriptorokhoz hagyományosan csak deszkriptor kapcsolódhat), továbbá hogy adott esetben viszonylag hosszú, több tagú kifejezések fölvételére is sort kell keríteni.

A magyar átfogó tezaurusz (OSZK-tezaurusz/Köztaurusz) és az ETO középkiadása közötti kapcsolódás kialakítása már egy éve zajlik, és lezárására csak egy-két éven belül kerül majd sor. Ennek során minden lexikai egységhez (ha ennek értelme van) kapcsolódni fog ETO jelzet. A tezauruszcikkek tehát tartalmaznak ETO-kapcsolatot, mely több értékű lehet. Ez a munka egyben a tezaurusz jelentős bővülésével is jár. A tapasztalatok arra utalnak, hogy ezáltal erősödik a tezaurusz egyetemes jellege, s nagyobb biztonsággal lehet előre jelezni, milyen további lexikai egységeket célszerű fölvenni a tezauruszba.