A TÁRGYI INFORMÁCIÓKERESÉS
ÉS FELTÁRÁS PROBLÉMÁI A WEBEN

DR VIRÁGOS MÁRTA
DEBRECENI EGYETEM EGYETEMI ÉS NEMZETI KÖNYVTÁR Marta@clib.dote.hu

DEBRECEN, 2001

 

Webalapú nyilvános online katalógusok: a hagyományoktól az innováció felé

Elvárható lenne, hogy az innovatív környezet innovatív termékek születéséhez vezessen.

A webalapú nyilvános online katalógusok azonban nem bizonyulnak ilyennek, mert szerkezetük, karbantartásuk és kezelésük túlzottan ragaszkodik a könyvtári hagyományokhoz. Az is csak a gyorsan fejlődő információ-technológia nyomásának, ezen belül az Internet megjelenésének köszönhető, hogy a cédulakatalógusokat hűen tükröző első generációs online katalógusokat egy második követte, amelyeknél már megjelentek a kereskedelmi adatbázisoknál használt hasonló visszakereső technikák. A katalógus fő funkciója az, hogy egyrészt a mű bizonyos adatai alapján megtaláljuk annak lelőhelyét, másrészt, hogy egy adott témához kikereshessük az adatbázisból az odatartozó dokumentumokat. A felhasználók zöme téma szerint keres, s eközben már többnyire a tárgy korrekt leírásánál fennakad, vagy belefullad a kapott információözönbe.

A nyilvános online katalógusok fejlesztése mindmáig a felhasználói interfész és a visszakereső rendszer tökéletesítésére irányult. A rendszerrel folytatott párbeszédben nagy szerephez jutott a normalizálás és a homogenizálás. A keresőmechanizmusoknak túl kellett jutniuk pl. a klasszikus Boole algebrán és a pontos egyezésen alapuló technikákon. Ugyanakkor nem sok erőfeszítés történt a hagyományos katalogizálási szabályokat tükröző MARC formátummal szakító adatbázisok kialakítására.

A forradalmian új technikák bevezetésének mindenütt három fázisa van: először a legkisebb ellenállást követve leutánozza a régit, azután már javít a régin, végül a benne rejlő lehetőségek kiaknázásával új irányt ad a fejlődésnek. A webalapú nyilvános online katalógusoknál valahol az első és a második szakasz között vagyunk.

Egy új technika érvényesülésének fontos feltétele a társadalmi befogadhatóság. Az Internet innovatív közegében az online katalógusok felhasználóbarátabbá váltak és tömeges használatukról beszélhetünk. Kikoptak a parancsnyelvek és funkcióbillentyűk, és a rendszerrel folytatott párbeszéd eszközei uniformizálódtak a web szabályai szerint. Bármely katalógus a konkrét cím vagy jelszó ismerete nélkül bárkinek bárhonnan hozzáférhető.

Ennek ellenére az Internet hatása mégsem olyan gyökeres, mint gondolnánk, hiszen a bibliográfiai adatbázisok megtartották hagyományos szerkezetüket, és nem profitáltak az őket körülvevő innovációból.

Ahogy Ungváry Rudolf megállapítja: " Az automatizált könyvtári és dokumentációs adatbázisok kereskedelmi forgalomban jelenleg beszerezhető kezelőrendszereinek többsége csak a betűrendes mutató kezelésére képes. Velük nem lehet megoldani, hogy a lexikai egységek közötti kapcsolatok (pl. Kutya lásd Eb, vagy Kutya F Állat) is megjelenjenek." (TMT 48. Évf.2001. 1.sz. 3 o) Azoknál adatbáziskezelőknél, melyek valamilyen szinten képesek a tezauruszok kezelésére az alábbi hibákkal találjuk magunkat szembe:

A web egyik legfontosabb jellemzője a hipertext kapcsolatok alkalmazása. Ez nagyon hasznos lehetne a könyvtári katalógusoknál, ahol már a hagyományos manuális technika is alkalmazta a "lásd" és "lásd még" keresztutalókat.

A mai webalapú katalógusok viszont a dokumentumok között csak a közös elemek pl. szerző, tárgy, cím szerint képesek kapcsolatot teremteni, mivel megtartják az eredeti MARC formátumot. A MARC legfeljebb csak hierarchikus kapcsolatrendszerek letérképezésére alkalmas. A hipertext struktúrájú webkörnyezethez való jobb alkalmazkodás érdekében át kellene térni más, pl. az SGML jelölőnyelven alapuló formátumokra. AZ SGML segítségével indexelhető és visszakereshető mind a dokumentum mind annak komponensei, nemcsak a megszokott Boole-algebrai és helyzeti operátorok útján, hanem új eljárásokkal is, pl. a relevancia szint vizsgálatával is. Továbbá: a felhasználó folyamatosan navigálhat tovább az adatbázisban és adatbázisok között, kézben tarthatja az indexelés, megjelenítés és kinyomtatás formátumát, stb.

A MARC szerkezete szigorúan kontrollált, s bár változó mezőhosszokat enged meg, a 100 000 karakteres maximális hossz csak a hagyományos könyvtári rekordokhoz elég, teljes szövegű adatbázisokhoz nem. A merev szerkezet nem ad helyet a linkek elhelyezéséhez. Ha viszont új formátumra térünk át, újra kell gondolni a katalogizálás egész filozófiáját és gyakorlatát. Egyes intézmények - így az OCLC, a WWW konzorcium, és a Kongresszusi Könyvtár - már kutatják a lehetőséget a bibliográfiai leírásnak az Internet céljára alkalmasabb, nyitott kódolására. A Kongresszusi Könyvtár 1998-ban közzétette az USMARC adatok SGML formátumú kódolását definiáló dokumentumot és a MARC-SGML konvertáló szoftvert, miután a WWW-konzorcium 1997-ben publikálta az SGML egyszerűsített, egyben HTML-utód változatát, az XML (eXtensible Markup Language) szabványt. Az XML segítségével nemcsak a weboldal megjelenését, hanem szemantikai struktúráját is le lehet írni.

A webalapú katalógusokban még nem lehet vándorolni tezaurusz jellegű kapcsolatok alapján. A manuális hagyományok szerinti tárgyszavas keresésnél a felhasználó szerepe a felismerés, viszont online üzemmódban a keresőkérdést önmagában kell megfogalmaznia. A webalapú nyilvános katalógusok alkotói eddig még elmulasztották ennek a lehetőségnek megfelelő kiaknázását.

A webtechnológia adottságait a webalapú nyilvános online katalógusok most még csak kevéssé használják ki. Igazán nagy a haladás viszont abban, hogy létrejött a korlátlan kommunikáció egymástól eltérő hardver- és szoftverplatformok között. E kommunikáció kulcsa a Z39.50 protokoll, amely rendkívül rugalmas mind a dokumentumformátumok (katalógusrekord, kép, hang, számszerű adat, teljes szöveg), mind a keresőkritériumok specifikálása terén.

Az egymással hálózatba kapcsolódó könyvtárak az elosztott ügyfél-kiszolgáló (kliens-szerver) architektúrában számos új funkciót képesek számítógépesíteni: pl. osztott katalogizálás, a rekordok exportálása és könyvtárközi kölcsönzés.

A digitális könyvtárak alapvető funkciója nem magának az Internetnek, hanem az Interneten megtalálható dokumentumoknak a katalogizálása. Mi tekinthető dokumentumnak az Interneten? Schamber (Journal of the American Society for Information Science, 47. 9. P. 669-671) a következő kategóriák átgondolását javasolja:

(1) Homogén dokumentum: hagyományosan a dokumentumot egyetlen fizikai entitásként értelmezzük, amelyet egy vagy több szerző alkotott, és ami véges terjedelmű, állandó, lineáris tartalommal bír. Ezen dokumentumok heterogén gyűjteményét általában tárgy szerint, vagy médium szerint tárolják.

(2) Hyperlinkekkel összekapcsolt heterogén dokumentum: az információs központok katalógusokon és index-rendszereken keresztül biztosítanak információhozzáférést. Ezek az eszközök lehetővé teszik dokumentumrekordok valamely közös jellemző alapján való visszakeresését. Az így visszakeresett halmazt foghatjuk úgy, mint egy céltudatosan egyesített meta-adatot. Jelenleg az információs központok gyakran használnak külön tárgy és médium szerinti katalógusokat.

(3) A kapcsolódó dokumentumok kontextuális megjelenítése: a kifinomult elektronikus rendszerek vissza tudnak hívni olyan dokumentumhalmazokat, amelyekben az egyes rekordok a tárgyi hasonlóság mértéke alapján rangsorolva vannak. Az igazán kreatív tervezők kifejlesztettek olyan háromdimenziós megjelenési formákat (piramisok, szobák, stb.), amelyek segítenek elképzelni a rangsorolt halmazokat. Ebben az esetben az egész halmaz egy meta-adatot képvisel.

(4) A felhasználó által létrehozott heterogén dokumentum.
Egy Internet katalógus létrehozásának egyik fő problémája az Internet dokumentumok és szolgáltatások tünékeny természete. Guedon úgy véli, hogy az elektronikus kiadás esetében egy külön osztályozási rendszert kell kialakítani, amely megfelel az elektronikus dokumentumok jellemzőinek.


Meta-adatok

A nyomtatott dokumentumok számítógépes katalogizálására a nemzetközileg elfogadott MARC formátum vált általánossá, de szakemberek szerint ez alkalmatlan a digitális dokumentum leírására. A legközismertebb kezdeményezés, ami új formátumot nyújt a digitális dokumentumok leírására, egy 1995 óta tartó nemzetközi konferencia sorozat eredményeképpen alakult ki, és a "DublinCore meta-adatok", vagy "Warwick Framework" néven vált ismertté.

Stuart Weiben, akit a Dublin Core kitalálójaként szoktak emlegetni, a meta-adatokat olyan egyszerű leírási formátumként definiálja, amelyeknek a célja a weben való keresés javítása egy nemzetközi megegyezés segítségével. Nagyon sok eltérő adatmodellel rendelkező adatbázis létezik, de bizonyos fokig valamennyi leírható a Dublin Core-nak nevezett közös adatmodellel. A DC fő célja, hogy a tartalom és a tartalmat leíró szintaktikai kifejezés közti függetlenséget fenntartsa.

A másik meta-adatszerkezet, a Harcest, a University of Coloradoban került kifejlesztése az ARPA (Advanced Research Projects Agency) támogatásával. Saját keresőprogramja és protokolja van, amely nem MARC alapú, de alkalmas közös platformként szolgálni hálózati adatbázisok között. A Harvest egy tartalmi összefoglalást készít is készít minden általa összegyűjtött tárgyról. Ezek a rekordok egy Summary Object Interchange Format (SOIF) nevű formátumban kerülnek tárolásra. A tartalmi összefoglalások bizonyos mértékig megfelelnek a MARC rekordokban alkalmazottaknak.

Ami az alkalmazott IKNY-t illeti, az Interneten található szinte összes szakterületi kapuszolgáltatás, portál, kalauz stb. nyújt a menüjén valamifajta logikus szerkezetű átfogó tárgyi megközelítést s bontja ki azt, vagy "házi készítésű" (home grown) kategóriák szerint /hudir. hu, Google.com stb./, vagy valamely osztályozási rendszer szerint. A "házi készítésű" kalauzokkal szemben a nemzetközileg elfogadott osztályozó rendszerek jelentős előnye a szabványosság, egységesség, az egységes alkalmazás. Az ETO és DDC szerepével Pálvölgyi Mihály tanulmánya foglalkozik. Az orvosi irodalom feltárására világszerte használt MeSH részletes elemzését találjuk Dr. Lantos Györgyi és Antalné Soós Katalin tanulmányaiban.

Egy komplex példa: a GERHARD /Harvest/

A Deutsche Forchungsgemeinschaft (DFG) által finanszírozott project GERHARD a "German Harvest Automated Retrieval and Directory" rövidítése, mely a német webes források automatikus visszakereső és kalauz szolgáltatása :http://gerhard.bis.uni-oldenburg.de/

Minőségi szolgáltatás, mely a tudományos szempontból releváns információk gyűjtésére, keresésére koncentrál. A projekt 1996 októberében kezdődött, az Oldenburgi Egyetemi Könyvtárban. A prototípus 1997 májusában vált hozzáférhetővé.

Az 1996-ban az ETO szerkezetére épített, éspedig a zürichi ETH könyvtárban használt bővített és többnyelves változatára.

A projekt célja az volt, hogy létrehozzon egy olyan eszközt, mely lehetővé teszi a német internetes források keresését és böngészését.

A webes dokumentumokat egy robot gyűjti, s azokat számítógépes nyelvi algoritmus alapján ETO tételekhez illeszti. Ily módon egy kereshető index /searchable index/ és egy automatikusan generált keresési fastruktúra /subject tree/ jön létre.

Egy újabb példa - a google.com könyvtára

A Google kulcsszavas keresőrendszere mellett (mely viszonylag gyors és pontos keresést tesz lehetővé, mert a weblapok univerzumában keresteti a kulcsszavakat a robottal), folyamatosan dolgozza ki könyvtárát /Internet-katalógus, directory/, melyben kategória-szintek szerint lehet keresni. Az induló fő kategóriák száma 11, melyek további 3-4 hierarchiaszintre bomlanak. A munka jellegzetessége, hogy egyes nyelvi változatai önkéntes bedolgozókkal készülnek, akik egy megadott feldolgozási szempontrendszer szerint dolgoznak. Az önkéntes bedolgozás természeten nem garantálja azt, hogy minőségi források kerüljenek be a rendszerbe, s az eddigi elemzések (2001. november 18) szerint a magyar részbe bekerülő források gyakran üzleti, reklámcélokat szolgálónak tűnnek.

E körbe tartozik a PRIDE projekt, mely: 1. internetes könyvtári szolgáltatások szabványosított forrása, 2. a keresésre alkalmas források azonosítására szolgáló munkaeszköz, 3. a használó számára a hozzáférés közvetítője és 4. a használót az új szolgáltatásokról informáló csatorna. (Lásd részletesen: LENK, Beata, 2000)

Tárgyköri zsilipek

A tárgyköri zsilipek egy-egy tárgykör digitális forrásaihoz vezetnek el. Információkereső nyelvként gyakran használnak szakrendet, vagy/és tezauruszokat a webhelyek és weboldalak intellektuális vagy automatikus indexelésére és visszakeresésére: az Art, Design, Architecture and Media - az Art and Architecture tezauruszt, az Engineering Electronic Library - az Engineering Information tezauruszát, az Organising Medical Networked Information - a MeSH tezauruszt, a Social Science Information Gateway - a HASSET tezauruszt. (SHIRI, Ali Asghar - REVIE, Crawford, 2000)

A Renardus program egyetlen interfészen biztosít majd hozzáférést igen jó minőségű ("high quality") európai internetes forrásokhoz. Ezt a felületet a Renardus-brókeren keresztül realizálják, amely a keresést és a böngészést különböző minőségileg ellenőrzött tematikus zsilipeken keresztül biztosítja. További cél a metaadatok megosztása, értékelése, kísérleti tesztelése, illetve bevezetése. (Pillanatnyilag közel ötvenezer releváns internet-ajánlat van az adatbázisban.) (Lásd részletesen: NEUROTH - LEPSCHY, 2000.)

A Renaldus nemzetközi szabványokat használ (Dublin Core, DDC, HTML, Z39.50, XML, RDF). Közös adatállományaiban való keresés előfeltétele az egységes adatmodell és metaadat-profil (egyeztetett szemantikával és szintaxissal). A nemzetközi, egységes alkalmazás a szabványok mellett technikai, szervezési és üzleti, valamint szerzői jogi stb. kérdéseiket is felvet. ( NEUROTH - LEPSCHY, 2000.)

A közös adatbázisok, így pl. Renardus nagy előnye, hogy az óriási adatmennyiséget bárki használhatja, de a résztvevőknek csak a sajátjukat kell folyamatosan karbantartaniuk. (NEUROTH - LEPSCHY, 2000)

Átfogó adatbázis a digitális forrásokról

Az OCLC az InterCat projektet követően indította el 1999 januárjában a CORC-projektet (Cooperative On-line Resource Catalog, http://oclc.org/oclc/corc/index.htm). A program célja, hogy a könyvtárak nemzetközi együttműködésével átfogó adatbázis épüljön az on-line forrásokról. A projekt során egyúttal tesztelik a szabványokat, technikai módszereket és eszközöket is. Feltárásra jelenleg az AACR2-t és a MARC-formátumot használják, de vannak már a metaadatokkal kapcsolatos kezdeményezések is, ilyen a göttingeni egyetem SSG-FI-programja (SonderSammelGebiets-Fachinformationsführer-Projekt, szakmai tájékoztatás gyűjtőköri megosztás alapján, http://www.sub.uni-goettingen.de/ssgfi/).

A program fontos eredménye, hogy lehetővé teszi ún. pathfinderek csatolások jegyzékei, illetve ún. "webliográfiák" csatolását is. A SUB ehhez az SSG-FI-rendszer alkalmazásával járult hozzá: az Allegroban kifejlesztettek egy adatexportáló rutint, amelynek segítségével az SSG-FI-kalauzok tételeit automatikusan eljuttatják a CORC megfelelő adatbázisába. (CREMER, Monika - NEUROTH, Heike, 2000)

InterCat

Az InterCat az Egyesült Államok nemzeti koordinált projektje a felsőoktatási intézmények és könyvtárak között egy olyan USMARC formátumú rekordokből álló adatbázis létrehozására, bevezetésére, tesztelésére és értékelésére amely az Interneten elérhető anyagok esetében kiegészül az elektronikus tárolásra és elérésére vonatkozó információval (USMARC 856-os mező). A projekt azt vizsgálja, hogy hogyan lehet a könyvtári szolgáltatásokat kiterjeszteni az Internet forrásaira, azaz hogyan lehet olyan szintű hozzáférést biztosítani az Internet forrásokhoz mint amilyet a könyv esetében elvárjuk a könyvtártól.

A projekt elindítása előtt az OCLC tanulmányozta az elektronikus információ tulajdonságait, és azoknak a szisztematikus elérésével kapcsolatos problémákat. A projekt céljai a következők: (1) lokalizálni és beazonosítani az Interneten elérhető elektronikus információk típusait, (2) kialakítani ezen információk taxonómiáját, (3) összegezni azokat a problémákat, amelyekkel a könyvtáraknak meg kell küzdeniük ezen információk beszerzése, katalogizálása, indexelése, tárolása, visszakeresése, és továbbítása során.

BUBL Subject Tree

A BUBL (Bulletin Board for Libraries) Subject Tree tűnik leginkább könyvtár-orientált projektnek. A BUBL volt az első olyan szolgáltatás az Egyesült Királyságban, amely tárgy szerinti felosztású hozzáférést biztosított az Internet forrásokhoz. Létrehozásakor a projekt szintén egyedi volt abból a szempontból, hogy Gopher források és World Wide Web dokumentumok feldolgozását egyaránt magába foglalta. Jelenleg a BUBL személyzete és az Egyesült Királyság egész területéről származó önkéntes szakreferensek közösen dolgoznak a tárgyi hierarchia részeinek fenntartásán. Csak olyan forrásokat dolgoznak fel, amelyek az egyetemi körök érdeklődésére számot tarthatnak.

Egészségügyi kísérletek

OMNI (Organising Medical Networked Information)

A különböző felhasználói csoportok által az Interneten végzett keresések visszahívási arányának és pontosságának javítására irányuló törekvések Nagy Britanniában az 1990-es évek közepén kezdődtek, s az OMNI akkor már épülő adatbázisának kiszélesítésével és a Joint Information Systems Committee támogatásával 1998 nyarán létrejött a BIOME. Az adott célközönség számára relevánsnak ítélt források minőségi revízióját a annak leírása követi, melyet a metaadatokkal együtt strukturált adatbázisban tárolnak.

Az OMNI (a hálózaton található orvosi információ rendszerezése) tehát a BIOME (http://biome.ac.uk/biome.html) nevű "átjárótár" részét alkotja, más szakterületi gateway programokkal, úgymint:

VETGATE - állatorvostudomány
BIORES - biológia, orvosbiológia (genetika, biotechnológia, virológia, biokémia, molekuláris biológia, stb.)
NATURAL - természet
AGRIFOR - mezőgazdaság, erdészet, élelmiszertudomány

Az OMNI-t a Nottinghami Egyetem Greenfield Orvosi Könyvtárának információs szakemberei és a téma szakértői készítik több brit és külföldi szervezet közreműködésével. Az OMNI értékelt, minőségi orvosi - egészségügyi információkhoz való hozzáférést biztosító gateway (átjáró) a Weben (http://omni.ac.uk/) diákok, kutatók, gyakorló orvosok és az akadémiai szféra számára.

A szolgáltatás értékelt forrásokhoz biztosít hozzáférést a megjelölt területeken, jól definiált forrásértékelő, katalogizáló és gyarapító politikát folytat. Kiadványa az Internet Resources for Health and Medicine c. füzet, mely 2000 júniusában az 5. kiadást érte meg, s az Internetről ingyenesen letölthető (http://omni.ac.uk/about/leaflet5.reprint2.pdf).

Az OMNI-ban végzett keresés eredményeként kapott forráslistát (az egyes tételek rövidebb-hosszabb leírást és MeSH tárgyszavakat tartalmaznak a forrás nevén/linkjén kívül) a MeSH szerkezetének csatolókkal ellátott releváns szelete egészíti ki (Példa: http://omni.ac.uk/browse/mesh/indices/a.html, http://omni.ac.uk/browse/mesh/detail/C0000786 L0000819.html), ahol lehetőség van kapcsolódó tárgyszórekordokhoz (szűkebb, tágabb illetve a fastruktúrában azonos szinten elhelyezkedő tételek) tartozó találati listák megtekintésére.

Advanced Search (Összetett keresés) módban a keresés kiterjeszthető a BioResearch adatbázis anyagára, valamint lehetőség van a keresés forrástípusra (levelezőlista, szoftver, folyóiratok (tartalomjegyzék + absztrakt vagy teljes szöveges) bibliográfiai adatbázisok, nem bibliográfiai adatbázisok, könyvek, forrásgyűjtemények, oktatási anyagok, híranyagok, beszámolók, szervezeti honlapok, betegtájékoztató füzetek, stb.) való szűkítésére, csonkolásra, csak brit források kiszűrésére, illetve a rekordmegjelenítés konfigurálására (http://omni.ac.uk/search/).

Az információforrások értékelésének szempontjai:

A webterület szerkezete, csatolóinak működése, téma és célközönség definíciója, súgó-funkciók, szerzőség és források megjelölése, a webmester elérhetősége, copyright, frissítés gyakorisága, hozzáférés korlátozása.

Az URL cím elemzése: milyen szerveren található a forrás (org/edu/com, stb.), a hosszabb visszagöngyölítésével kapott oldalak működnek-e.

Tartalmi elemzés: tárgykör(ök), információtípus(ok), átfogó-e a téma feldolgozása, részletesség foka, feltűnő hiányosságok, a közölt információk igazságtartalma, érvényessége (ez utóbbira az utolsó módosítás ideje is utal).

A forrás elérhetősége, esztétikai megjelenése, szerkezete, áttekinthetősége, használatának nehézségi foka (súgó, kiegészítő szolgáltatások).

Más értékelések a forrásról, ezek összevetése a fentiekkel.
A forrás összehasonlítása más hasonló forrásokkal.
Health on the Net Foundation - Egészség a Neten Alapítvány

A Health on the Net Foundation (HON) 1995-ben Svájcban, 11 ország 60 képviselője ( kutatók, fizikusok, valamint a WHO, a National Library of Medicine, a CERN, az EU képviselői) által alapított non-profit szervezet, amely az egészségügyi szféra jobb, gazdaságos működésének érdekében mind a szolgáltatói, mind a fogyasztói oldalt hiteles, megbízható információkkal kívánja ellátni. A HON vezető szerepet tölt be a Webfejlesztők számára kidolgozott etikai követelményrendszer közreadásában.

Az alapítvány webterületén (http://www.hon.ch/) szakterületi webcímgyűjtemény (beleértve az ismert kórházi webcímeket), nemzetközi konferencia-naptár, hírek, tájékoztató anyagok, és két, különféle információforrásokat prezentáló keresőszolgáltatás (MedHunt és HONselect) áll az egészségügyben dolgozók és orvostanhallgatók rendelkezésére. A MedHunt kulcsszavas (szabadszöveges) keresőrendszer, míg a HONSelect-ben a MeSH 33 ezer tételes tezauruszának segítségével kereshetünk.

A site szolgáltatásai mindenki számára ingyenesen hozzáférhetők, ám azok a felhasználói csoportok információigényének megfelelően vannak tálalva (betegtájékoztató - egészségügyi szakemberek - webfejlesztők). A betegtájékoztatást célzó oldalon kiemelt helyen találunk tájékoztató anyagokat (HON Dossier) pl. az anyaság, öregedés, allergia, Hepatitis B, stb. témakörében. A szakembereknek szóló oldalon ezt a helyet a konferencianaptár foglalja el.

A HON három, az Internet hatékony használatát segítő szolgáltatást kínál:

MedHunt

A MedHunt a HON orvosi és egészségügyi Webforrásokat szolgáltató teljesszöveges keresője, mely a saját fejlesztésű MARVIN (Multi-Agent Retrieval Vagabond on Information Networks) robottal dolgozik. A MARVIN az orvosi szótár alapján folyamatosan keres a Weben és frissíti a MedHunt adatbázisát. A weboldalak vizsgálata során megszámolja és szótára segítségével súlyozza az ott talált orvosi kifejezéseket (a fordításokat is beleértve). A MARVIN számára a HON a meglévő orvosi tárgyszórendszerekből (MeSH, a Heyman Gyógyszertani Intézet nyolcnyelvű szógyűjteménye) építette ki saját tezauruszát, mely jelenleg a 33 ezer MeSH tárgyszón kívül 20 ezer többnyelvű orvosi kifejezést (12 ezer angol-francia, valamint dán, holland, német, olasz, portugál és spanyol) tartalmaz. A MARVIN által épített adatbázisok a MedHunt-on kívül további keresőszolgáltatások alapjául is szolgálnak (2DHunt, BioHunt, PACSHunt, HON index, ExPASy index).

A MedHunt a találatokat - azok megbízhatóságát és hitelességét jelölendő - a következő kategóriákba osztályozva tálalja:

HONcode-ot elfogadó címek
A HON által elismert címek
A MARVIN által automatikusan talált címek.

Ezen kívül a MedHunt felajánlja a keresőkérdés más nyelvű változatait, definícióját, kapcsolódó témákat, illetve a találatok lelőhely szerint is osztályozhatók.

HONselect

A HONSelect egy integrált szakterületi keresőszolgáltatás, mely a MeSH 33 ezer szavas tezaurusza alapján többnyelvű keresést (angol, francia, német) képes végezni a Web különféle forrásainak integrálásával, s a keresési eredmények strukturált megjelenítésével. A MeSH tezaurusz hierarchiájában való navigáción túl a HONselect négy további adatbázis találatait prezentálja:

MEDLINE bibliográfiai adatbázis tételek, MeSH altárgyszavak szerint mappákba rendezve,
HONmedia, a HON MeSH alapján rendszerezett képgyűjteménye,
NewsPage - napi orvosi hírek, valamint
MedHunt találatok.
HONcode

A Health on the Net-en elérhető információk minőségét ("reliability and credibility:" megbízhatóság és hitelesség) az alapítvány által kidolgozott kódrendszer (HONcode) segítségével kívánják biztosítani. A problémát ugyanis nem az információk megtalálásában, hanem azok relevanciájának, hitelességének ellenőrzésében látják. A HONcode szabályai arra irányulnak, hogy a webhelyek szerzőivel betartassák az etikai szabályokat, és segítsék a felhasználót az adott anyag hitelességének (az olvasott információ forrásának és céljának) értékelésében.

 


TARTALOM