Ontology-based Information Retrieval and Fusion Systems

Ontológia-alapú Tudástárház Rendszerek

Dezsényi Csaba, Varga Péter, Mészáros Tamás, Strausz György, Dobrowiecki Tadeusz

Méréstechnika és Információs Rendszerek Tanszék,

Budapesti Műszaki és Gazdaságtudományi Egyetem (BMGE),

Budapest, 1117, Magyar tudósok körútja 2.

{dezsenyi, pvarga, meszaros, strausz, dobrowiecki}@mit.bme.hu

1. Bevezetés

A bemutatásra kerülő információ elemzési és kinyerési technikák fejlesztése az "Információ és Tudás Tárház" (angol rövidítés: IKF) projekt keretében zajlik. A projekt fő célja egy olyan újfajta Intelligens Tudás Tárház Rendszer elemzése, specifikálása és kivitelezése, amely lehetővé tesz fejlett Tudás Menedzsmentet és Üzleti Intelligenciát különböző meghatározott alkalmazási területeken. Az IKF alkalmazások a piaci szektor széles körét lefedik: pénzügy (bankok és biztosítótársaságok), egészségügy, banki szabályozások, oktatás és képzés, jogi információk, ipar. Ezeknek a területeknek kulcsszerepük lesz az egyes IKF keretrendszerek technológiai eszközeinek hangolásában [1].

A magyar konzorcium feladata egy tudásalapú információ-visszakereső rendszer kifejlesztése pénzügyi cégek és bankok részére. A rendszer fő tevékenysége az információ téma-specifikus, különböző forrásokból (internet, intranet erőforrások, adattárházak, stb.) történő beszerzése és elemzése, és az információ strukturált szolgáltatása a felhasználók felé. Ez különböző döntéstámogató megoldások alapját képezheti a magyar banki vagy egyéb üzleti szektorban.

A következőkben az IKF-H prototípus rendszer információ beszerzés oldali folyamatait összegezzük. A rendszer elsősorban magyar nyelvű dokumentumokat gyűjt be és elemez az internetről, amely új problémákat vet fel a hagyományos információ kinyerési technológiák alkalmazásánál.

1.1. A probléma általános modellje

Az IKF rendszer absztrakt környezet modellje három fő részre osztható (1. ábra): A Cél Környezet (pl. az aktuális cégek, ügyfelek, stb.), Az Információ Forrás Környezet (pl. internet, adattárház, stb.) és az Információ Felhasználási Környezet (pl. banki menedzsment, személyzet, stb.).

A Cél Környezet (Target Environment) a témához kapcsolódó tudás fizikai forrása, a valós világ objektumait tartalmazza, azok közötti relációkat, összefüggéseket, stb. Ez mind a két másik környezetet meghatározza, illetve befolyásolja. A rendszerhez szükséges tudásbázis, tudásmodell a Cél Környezet elemzésével, modellezésével jöhet létre.

Az Információ Forrás Környezetben (Information Cumulating Environment) találhatóak azok a dokumentumok, szöveges anyagok, melyek egyrészt tükrözik a Cél Környezet modelljét, másrészt tartalmazzák a szükséges információt a rendszer számára és elérhetőek digitális úton.

Az Információ Felhasználási Környezetben (Information Utilization Environment) helyezkednek el azok a felhasználók, akik bizonyos tudást akarnak beszerezni a Cél Környezetről, hogy céljaikat elérjék. Ezt az Információ Forrás Környezetből tudják kinyerni a rendszer segítségével.

Egy korábbi publikációban bemutattuk a problémakör általános modelljét, illetve egy ajánlott magas-szintű IKF architektúrát [2,3]. Az architektúra három fő komponensből áll: Dokumentum Beszerző és Elemző, Információ Menedzser, illetve Információ Lekérdező modulok. A következőkben a Dokumentum Beszerző és Elemző modult mutatjuk be részletesen. Ez a modul gondoskodik a dokumentumok forráskörnyezetből történő beszerzéséről (tipikusan a világhálóról), illetve az adott alkalmazás igényeinek megfelelően, a dokumentumok elemzéséről.

1. ábra: Az IKF Információs folyam

2. A tárgyterületi tudás megjelenése

Az IKF projekt célja mind a funkcionalitásról szóló általános jellegű, mind a tárgyterületről szóló specifikus jellegű tudás beépítése az IKF Alkalmazásba. Ezt a célt tölti be a Tárgyterület Modellező alrendszer.

Nyilván a tárgyterületi tudás és a funkcionalitás általános tudása csak tárgyában válik el, tárolásának technológiája azonos. Erre a technológiai feladatra az IKF projekt - a lehetőségek alapos felmérése után - a mesterséges intelligencia logikai-tudásreprezentációs irányzatának egy megoldása, a tudást tároló ontológiák alkalmazása mellett kötelezte el magát.

2.1. Tudás modellezése ontológiák segítségével

Az ontológia görög kifejezés, és már régóta ismert a filozófiában. Ez a tény jelzi, hogy az ontológia, mint tudásreprezentációs informatikai eszköz erős interdiszciplináris gyökerekkel, megalapozott háttérelmélettel rendelkezik, ugyanakkor - főként a kilencvenes évek derekától kezdve - a mesterséges intelligencia kutatásának bevett fogalma és gyakorlatának produktív eszköze lett.

Az ontológia feladata a működő rendszerekben - leegyszerűsítésekkel - az, hogy karakterizálja a tudást tartalmazó tudásbázis lehetséges feltöltöttségeinek olyan megszorítását, amely biztosítja, hogy a tudásbázis minden lehetséges tartalma összhangban legyen a (valós világbeli) fogalmi sémával (mindennek elméleti kifejtését ld. pl. [7]).

Az ontológiák választását a tudásreprezentáció szerepére az is motiválta, hogy az IKF projekt megcélozta gazdasági tárgyterület és az azt leíró gazdasági nyelv egy elméleti diszciplína, a közgazdaságtudomány hatására formálódik, tehát - várhatóan és részben beigazoltan - logikailag feltárhatóak fogalmi viszonyai. Ugyanakkor az informatikai ontológia-kutatás jelenleg az elosztott előkészített tudásrészeken operáló ágensek interoperabilitásának (szemantikus web) megteremtésére törekszik. Ez hosszú távon lehetővé teszi az IKF Alkalmazás és a szemantikus web rendszerei közti könnyebb átjárhatóságot, a jelenben azonban megoldandó feladatot jelent, mivel az IKF Alkalmazás forráskörnyezetének dokumentumai jelentős részben gép feldolgozásra előkészítetlenek (lévén csak embereknek íródtak), tehát az ontológiákkal kapcsolatos eddigi eredmények közvetlenül nem vehetők át. Mindez az IKF projekt saját ontológia-elképzelésének (szintaxis és szemantika) kialakítását tette szükségessé.

2.2. Az IKF Alkalmazás saját ontológia-elképzelése

Az egyes ontológiák vázát taxonomikus struktúrák összessége adja. Egy taxonómia lényegileg fogalmak tartalmazási reláció (is-A) szerinti irányított fagráfja. A modellezett tudás szempontjából a tartalmazás reláció egy fogalmat (az ún. nemfogalmat) több fogalomra (ún. fajfogalmakra) bont. A gráf minden csomópontjában (a levelekben is) fogalom áll, ugyanakkor mindegyik csomópontnak lehet példánya. Az ontológiában előre rögzített számú és szemantikája (ez rögzített felső fogalmakat jelent) fagráf lehet. Az egyes fagráfokat kategóriáknak (pl. szubsztancia, mennyiség, minőség, viszony kategóriái stb.) nevezzük és interdiszciplináris megfontolások alapján határoztuk meg. (A jelenlegi tárgyterület modellező alrendszer tíz ilyen kategóriát ismer). A kategóriák a lentebb ismertetendő funkcionalitásoban kapják meg jelentőségüket, de egyben irányadó segédeszközként is szolgálnak az ontológiák építésekor.

A fogalmak csupasz tartalmazási relációi azonban nem elegendőek. Egymás közti viszonyaikat az interkategoriális kényszerek modellezik. Az interkategoriális kényszer (akár különböző kategóriájú) fogalmakat köt össze: azt modellezi, hogy az egyik fogalom milyen (akár komplex) fogalmat von maga után.

Az IKF projekt során kialakult ontológia-elképzelés ugyan logikai tudásreprezentációs eszközt használ, de a logikai precizitást csak a forráskörnyezet (strukturálatlan szabadszöveges dokumentumok) megszabta mértékben alkalmazza. A logika szükségessége a fogalmak közti kizárási viszonyok és a komplex interkategoriális kényszerek miatt jelenik meg (amik következtében nem triviális feladat, pl. egy összetett fogalom tartalmazási reláció szerinti vizsgálata).

Az IKF Alkalmazás ezen alrendszerét tényleges használatbavétele előtt tehát még paraméterezni kell, azaz fel kell tölteni a feladat- és intézmény-specifikus tárgyterületi tudással. Ugyanakkor az IKF projekt célja ezen paraméterezés megkönnyítése mind a tárgyterületi modellépítő komponenssel, mind a tudástárban már előzetesen meglévő részlegesen elégendő tudással.

3. Információ beszerzés

Egy általános probléma amivel szembe kell néznünk a Forrás Környezetben tárolt, Cél Környezetre releváns információval kapcsolatos. A felhasználóknak általában nincsen kellő ismeretük arra nézve, hogy a keresendő adatok, tudásanyag hogyan van tárolva a forrásokban. Az IKF rendszer feladata, hogy ezeket a modelleket felfedje és beszerezze a szükséges információkat a felhasználók számára.

Annak ellenére, hogy manapság igen sok információforrás szolgáltat hasznos adatokat a különböző tárgyú alkalmazások számára, az emberi értékelésre még mindig szükség van a releváns információ kiválasztásához, hiszen a legtöbb forrás tartlama strukturálatlan formában áll rendelkezésre. Az egyik fő vezérvonala az IKF megközelítésnek az, hogy különböző, tárgyterület specifikus tudás-modell felhasználásával kell támogatni az információ beszerző folyamatokat. A következőkben az IKF prototípus rendszer információ beszerző moduljának strukturáját fogjuk megvizsgálni, majd rátérünk az ontológia alkalmazására.

3.1. Az IKF Információ Beszerző rendszer

Az Információ Beszerző alrendszer feladata, hogy miközben automatikusan bejárja az információ forrásokat, beszerezze a megfelelő dokumentumokat és egy előelemzés segítségével előkészítse a további, mélyebb információ kinyeréshez. Maga a modul ágensként viselkedik [5]: a céljait más IKF moduloktól kapja meg (mint dokumentum forrás URL-ek és keresési minták), a felkonfigurált célokat pedig a megfelelő dokumentumok felkutatásával, beszerzésével és elemzéséval éri el [2,4]. A rendszer felépítése és működési mechanizmusa az alábbi ábrán látható (2. ábra).

2. ábra: A dokumentum beszerző alrendszer architektúrája

A rendszer a következőképpen működik: az URL regiszter a forráskörnyezetről épít egy belső, gráf-alapú modellt működés közben. Ezzel megvalósulhat, hogy a webrobot ne csak a közvetlen környezetét érzékelje lokálisan, hanem globális képe legyen a már megismert forráskörnyezetről. A belső modell segítségével hatékony gráf-alapú algoritmusok implementálhatóak, amelyek az URL-kiválasztási mechanizmust vezérlik. A Downloader modul feladata, hogy a regiszter által kiválasztott címen lévő dokumentumot letöltse a forráskörnyezetről (az internetről) és előállítsa az ún. IKF Forrás Dokumentumot, ami egy XML fomrátumú belső reprezentációja az eredeti forrásdokumentumnak.

A következő lépés a forrásdokumentumok elemzése. Ezt a Forrás Tartalom Elemző egység végzi, amely azért felelős, hogy a bejövő dokumentumok bizonyos strukturális és egyéb fontos jellemzőit felismerje. Ennek segítségével előállítja az ún. Tartalom Objektumokat, amelyek a különböző típusú releváns információkat tartalmazzák, amelyeket az eredeti dokumentumból nyer ki az elemző. A Tartalom Objektumok technikailag XML dokumentumok, amelyek a felkonfigurált alkalmazástól függően tartalmazzák strukturált formában a kinyert információ-elemeket. A felkonfigurálástól függöen lehet az objekumoknak típusuk, például egy általános és egyszerű típus lehet olyan, amely egy dokumentumból kinyert linkeket tartalmazza.

A Tartalom Objektumokban az XML címkék tipikusan strukturálatlan szövegrészleteket fognak közre, azonban ezek a töredék szövegek tartalmazzák az alkalmazás számára lényeges információt, amelyet a további IKF elemzők kinyernek. A Forrás Tartalom Elemző szöveges statisztikai elemzést is végrehajt a Tartalom Objektumokon, amivel pontosabb képet kap a rendszer az adott objektumról. Az elemző a létrejövő indexet és statisztikai relevancia információt az objektumhoz csatolja.

3. ábra: Példa a forrásdokumentum elemzésre

Az fenti ábrán (3. ábra) egy példát láthatunk arra, hogy a rendszer milyen formában vágja ki a szükséges információt egy portál cikkeiből. A baloldalon található maga a portál cikk. A cikket magábafoglaló oldal számos zavaró elemet is tartalmaz (hírek, menük, linkek, stb.), amelyek nem kívánatosak az alkalmazás számára. A jobboldalon pedig az "article" típusú tartalom objektum látható, amely az elemzés során létrejött. Ebben az egyszerű példában a cikk címe, szerzője, dátuma, szöveges tartalma, illetve a cikkben szereplő hivatkozások lettek kigyűjtve.

4. Az ontológiákra épülő funkcionalitások

Mi a haszna a tudás modellezésének az IKF projekt céljainak szempontjából? Erre a kérdésre az ontológiára épülő funkcionalitások adják meg a választ. Ezeket a funkcionalitásokat az IKF projekt során folyamatosan fejlesztjük.

4.1. A keresőkérdésekkel kapcsolatos funkcionalitások

A keresőkérdéssel kapcsolatos funkcionalitásokat már sikeresen kidolgoztuk és - prototípus szinten - implementáltuk is. Az implementáció két funkcionalitást valósít meg. Az első funkcionalitás arra az igényre válaszol, hogy a természetes nyelv és a Dokumentumtár indexelt dokumentumainak indexnyelve közt komoly különbségek lehetnek (poliszémia, szinonímia stb. miatt). A másik funkcionalitás pedig abból indul ki, hogy egy indexalapú keresés sikerességét sokban javítja egy gondosan kiválasztott, több-összetevős keresőszó-lista.

A két funkcionalitás együttese tehát a természetes nyelven megfogalmazott keresőkérdést úgy alakítja át a Dokumentumtár indexnyelvén megfogalmazott keresőkérdéssé, hogy nem csak a keresőkérdés szavainak indexnyelvi megfelelőjét tartalmazza, hanem a háttértudás által vonatkozónak tartott indexnyelvi szavakat is. Ez a kibővítési eljárás bővítési operátorok használatával történik. Először meg kell keresni a természetes nyelvi szavak által jelölt fogalmak ontológiabeli megfelelőjét, mert a bővítési operátorok az ontológián értelmezettek. Minden bővítési operátor egy adott fogalomból kiindulva három fogalomlistát eredményez: a tartalmazó, az azonos és a tartalmazott fogalmak listáját. Ehhez a három fogalomlistához három különböző súlytényező is tartozik (az eddigi tapasztalatok alapján a legkisebb súllyal a tartalmazott fogalmakat kell figyelembe venni, míg az azonos fogalmak súlytényezője természetesen egységnyi). A konkrét bővítési operátorok ennek a sémának a kitöltésével származtathatók: a kiinduló fogalom lehet a keresőkérdés fogalma (a tapasztalat alapján a bővítési operációnál vagy-szemantikát kell alkalmazni), annak negáltja és az interkategoriális kényszerei által implikált fogalmak. A bővítési operátorok konkretizálása során ismét megjelenik egy súlytényező (pl. a negált esetben negatív egységnyi, az interkategoriális fogalmaknál egy diszkontáló jellegű tényező), amely a másik súlytényezővel összeszorzódik.

Ezután a fogalomból az indexnyelvi szót kell származtatni. Mivel egy fogalomhoz több indexszó is tartozhat, amelyek közül egyesek kevésbé jellemzőek, ezért itt ismét fellép egy súlytényező. Az összevont funkcionalitás kimenetén ennek a konverziónak az eredménye jelenik meg.

A keresőkérdéssel kapcsolatos két, összevont funkcionalitás fő hátránya az IKF projekt jelenlegi szakaszában, hogy csak az ontológiában megtalálható fogalmakat közvetlenül megnevező szavakat tudja hasznosítani. A továbblépéshez a példánykezelés bevezetése szükséges. Ez a tervbe vett következő funkcionalitás melléktermékeként lenne lehetséges.

4.2. Az információkinyerő funkcionalitás

Az IKF projekt jelenlegi szakaszában intenzív munka folyik egy újabb funkcionalitás kidolgozására. A Morphologic Kft. morfoszintaktikai elemzőjére támaszkodva készült a projekt keretében egy mondatelemző, amelynek kimenetét az ontológiához kell kapcsolni. Ez - az eddigi kísérletek alapján - várhatóan lehetővé tesz szövegmegértési jellegű, mindazonáltal nem teljes információkinyerést a természetes szövegekből. A melléktermékként létrejövő fogalom-példány megfeleltetésekből pedig a fent leírt keresőkérdés-kiegészítő funkcionalitás is profitálhat.

4.3. Implementáció és példafuttatás

Mint említettük, az IKF projekt keretében a keresőkérdés-kiegészítő funkcionalitáshoz egy prototípus szintű implementáció is készült. Az implementáció egy többszálú Java komponens, amely TCP/IP socketeken keresztül kommunikál XML formátumban. Ontológiai és konfigurációs adatait szintén XML formátumban tárolja.

Az implementációhoz fel kellett használni egy leíró-logikai (description logic) következtetőgépet, amely a funkcionalitás igényelte logikai apparátust biztosítani tudta. Ehhez a Ian Horrocks készítette Fast Classification of Term (FaCT) rendszert használtuk fel (ld. [6,8]). Ez egy LISP modul, amellyel CORBA interfészen át lehet kommunikálni. A leíró-logikai következtetőgép kiválasztása csupán a prototípus implementációjának szakaszára szólt, az IKF projekt további szakaszában elképzelhető egy előnyösebb tulajdonságú másik következtetőgép választása. Ezt a flexibilitást az teszi lehetővé, hogy a következtetőgéppel való kommunikációhoz szükséges fordítást csak a lehető legalsó rétegben végezzük el.

Tekintettel a magyar nyelv agglutináló jellegére, a komponens bemeneté érkező szavakat az említett morfoszintaktikai elemző a további konverziók előtt tövesíti.

A prototípus szintű implementáció bizonyította az elképzelést működőképességét, és rámutatott a továbbfejlesztést igénylő pontokra. Felmerült azonban az igény a funkcionalitás eredményességét kvantitatív és kvalitatív módon jellemző teszt iránt. Ezt kielégítendő egy olyan teszt készült, amely a funkcionalitásnak konkrét keresési szituáció eredményére gyakorolt hatást vizsgálta. A keresés célja a számítógépes biztonságtechnikából ismert ún. exploitokkal kapcsolatos dokumentumok megtalálása volt (a szó poliszémiája és a különböző kontextusok miatt a klasszikus index-alapú keresési módszer nagyon rosszul teljesítenek, pl. egy népszerű keresőportál első tíz találatából négy irreleváns). Olyan dokumentumokból indultunk ki, amelyek tartalmazzák az "exploit" szót. Az IKF Alkalmazás forrásdokumentum-beszerző rendszere kollekció 101 ilyen dokumentum kollekcióját hozta létre (összesen 1.2 MB méretben), amelyek között - a kereséséi szituáció természetéből fakadóan - tematikailag irreleváns dokumentumok is voltak. A keresést (azaz a relevánsnak ítélt dokumentumok kiválogatását és a találatok rangsorolását) egy a vektormodellt használó indexelő program végezte, amely szintén az IKF projket részeként készült. (Mint ismeretes ebben a keresési modellben a dokumentum illeszkedését a keresőkérdés és a dokumentum indexszavak terében értelmezett vektorai által bezárt szög koszinuszával lehet mérni.) tesztcélú ontológia az operációs rendszerek, az exploit és néhány hasonló fogalom kapcsolatát modellezi (természetesen ez elkészítésekor nem törekedhettünk sem a teljességre, sem a tárgyterület precíz modellezésére). A mini-ontológia taxonomikus váza a 4. ábrán látható (a megjelenítetteken kívül még három interkategoriális reláció is szerepelt az ontológiában). A korábbiakban leírt modul a keresési kérdést az 5. ábrán látható módon bővítette ki.

A teszt eredményeinek kvantitatív értékelése a 6. ábrán látható, amely az egyes találati pozíciókban álló dokumentumokra számított numerikus relevancia-becslést tartalmazza (a koszinuszos vektormodellt használva). Mint látható, a kiegészített keresés nem csak magasabb relevancia-értékeket szolgáltat (ez még önmagában nem lenne jelentős, mert a felhasználó nem a relevancia-becsléssel, hanem a találati pozícióval találkozik), de jobban ki is emeli az eredményeket, ami relevancia-küszöbérték alkalmazása esetén kevesebb, de várhatóan relevánsabb eredményhez vezet. A kvalitatív értékéléshez az egyes találati pozíciókban szereplő dokumentumokat manuálisan a releváns-szemi-releváns-irreleváns kategóriákban soroltuk. A keresések eredményeinek ilyen értékelése a 7. ábrán látható.

6. ábra (A teszt eredményeinek kvantatív értékelése)

7. Ábra (Az eredmények kvalitatív értékelése)

A második keresés nyilvánvaló fölényéből kiemelhető, hogy sikerült az első találatot is relevánssá tenni, ami különös fontosságú, ha a keresés eredményét gépi utófeldolgozásra szánjuk.

Összefoglalva megállapítható, hogy a keresési kérdés kibővítésének módszere megfelelő tárgyterület-specifikus ontológia feltételezésével jelentős javulást hozhat mind a keresés relevanciájában, mind a keresés pontosságában. Fontos leszögezni, hogy ez a vizsgálat a tisztán keresőkérdés-bővítő funkcionalitásra koncentrált, nem foglalkozott a természetes nyelv és az indexnyelv közti fordításból származó előnyökkel. Mindez bizonyítja az eddigi eredmények hasznosíthatóságát. Természetesen a továbbfejlesztés említett igénye mindezek ellenére fennáll, amint jelenleg is intenzív munka folyik ezeken a területeken az IKF projektben.

5. Összegzés

Bemutattuk, hogy az IKF projekt szemlélete tükrében hogyan épül fel egy általános információ és tudás tárház rendszer dokumentum beszerző alrendszere. Kulcsfontosságú feladat az ilyen rendszer hatékony alkalmazhatósága szempontjából egy megfelelő tárgyterületi ontológia megalkotása és implementálása, amely alapját képezi az alkalmazható tudás-kinyerő módszereknek. Praktikus és teoretikus megfontolásokból is előnyös olyan ontológia szerkesztése, amely a különböző tárgyterületi fogalmakat olyan struktúrába próbálja szervezni, mint ahogyan az az emberek gondolati világában jelenik meg.

A kifeljesztett prototípus rendszer autonóm módon kutat fel és szerez be dokumentumokat különböző információs forrásokból (pl. webes erőforrások, itt magyar elektronikus pénzügyi publikációk). A bemutatott ontológiára alapozott keresőkkérés kiterjesztő funkcionalitást meg lett tervezve és implementálva lett.

Letöltés után a rendszer a felkonfigurált forrás modellek alapján a bejövő dokumentumot elemzi és a kinyerhető információ-elemeket megfelelő XML dokumentumokba (tartalom objektumokba) transzformálja. Ezen kívül különböző statisztikai szöveges elemzéseket is végez az objektumokon. Ez a művelet a magyar nyelv specialitása következtében néhány nyelvészeti elemzést is magába foglal.

A prototípus rendszer fejlesztése továbbra is folyik és még sok munka szükséges ahhoz, hogy egy a valós élet alkalmazásai között is helytálló eszköz szülessen. Azonban már az eddigi munka is rengeteg tapasztalatot adott egy ilyen rendszer lehetőségeivel és korlátaival, működésével és teljesítő képességével kapcsolatosan.

A prototípus első változatával történt tesztek tapasztalatai alapján látható, hogy a rendszer képessége alapvetően függ a beépített ontológia fejlettségétől illetve, hogy a nyelvi eszközök új nyelvtanokkal történő bővítése és az egyre jobb nyelvi elemzés után is fennmaradó bizonytalanságok heurisztikus kezelése a továbbfejlesztés legfontosabb elemei kell hogy legyenek.

6. Hivatkozások

[1] EUREKA PROJECT "IKF - Information and Knowledge Fusion", Institute of Cognitive Sciences and Technology, Laboratory for Applied Ontology, March 2000.

[2] "The IKF architecture", IKF project report, Budapest University of Technics and Economics, Department of Measurement and Information Systems, August, 2002.

[3] T. Mészáros, Zs. Barczikay, F. Bodon, T. Dobrowiecki, Gy. Strausz, "Building an Information and

Knowledge Fusion System", IEA/AIE-2001 The Fourteenth International Conference on Industrial &

Engineering Applications of Artificial Intelligence & Expert Systems, June 4-7, 2001, Budapest, Hungary

[4] Cs. Dezsényi, T. Mészáros, "Domain Knowledge Based Document Retrieval", IEEE-TTTC - International Conference on Automation, Quality and Testing, Robotics, Cluj-Napolca, Romania, May 2002.

[5] J. M. Broadshaw, "Software Agents", The MIT Press, 1997

[6] S. Bechhofer, I. Horrocks, P. F. Patel-Schneider, and S. Tessaris, "A proposal for a description logic interface" In P. Lambrix, A. Borgida, M. Lenzerini, R. Möller, and P. Patel-Schneider, editors, Proceedings of the International Workshop on Description Logics (DL'99), pp. 33-36, 1999.

[7] Guarino, N., "Formal Ontology in Information Systems" In N. Guarino (ed.) Formal Ontology in Information Systems. Proceedings of FOIS'98, Trento, Italy, 6-8 June 1998. IOS Press, Amsterdam

[8] I. Horrocks, "Using an expressive description logic: FaCT or fiction?" In A. G. Cohn, L. Schubert, and S. C. Shapiro, editors, Principles of Knowledge Representation and Reasoning: Proceedings of the Sixth International Conference (KR'98), pp. 636-647. Morgan Kaufmann Publishers, San Francisco, California, June 1998.