Ontológia-alapú Tudástárház Rendszerek

 

 

Az előadás keretében egy nyelv- és témaspecifikus információ beszerző, elemző és szolgáltató rendszer általános architektúráját és tudás-orientált technikai megoldásait mutatjuk be. A teljes rendszer a különböző tudás-intenzív technológiai és elméleti kihívások tükrében került megvalósításra. Ez magába foglalja a témaspecifikus dokumentumok automatikus keresését és begyűjtését a webről, a különböző, nem- vagy alig-strukturált szöveges források elemzését és így a tudás kinyerését, illetve a kinyert tudás tárolását és a felhasználók felé történő tálalását. Ezen kívül speciális megoldásokat igényel a magyar nyelvű szöveges dokumentumok nyelvészeti elemzése is.

Az említett rendszer fejlesztése a nemzetközi Információ és Tudás Tárház (Information and Knowledge Fusion - IKF) projekt keretében zajlik. A projekt globális céljai között elsősorban új intelligens tudás beszerző, elemző és kezelő rendszerek tervezése és implementálása szerepel, amelyek különböző alkalmazási területeken nyújtanak hatékony segítséget a tudás-menedzsment szinten [1]. A magyar konzorcium (IKF-H) a gazdasági szféra számára fejleszt tanácsadó és döntéstámogató alkalmazásokat. A rendszer célja, hogy a weben hozzáférhető heterogén és strukturálatlan magyar nyelvű információ forrásokból a lehető legtöbb tudást kinyerje és ezt felhasználva támogatást nyújtson bankok és egyéb pénzügyi szervezetek számára.

Ahhoz, hogy egy tipikus információ beszerző rendszer teljesítményét felülmúljuk, az emberek által végzett információ keresés és elemzés folyamatát kell megvizsgálnunk és - legalább részben - követnünk. Az emberi intelligencia két fő összetevőjén múlik az említett folyamat sikeressége: (1) a nyelvészeti szakértelem és (2) a rendelkezésére álló tudás használatán. Mivel a különböző nyelvészeti technikák gyorsan fejlődnek és az alkalmazásuk számos egyéb információ elemző rendszerben is előfordul, a legnagyobb kihívást a megfelelő tudásbázis kilalkítása és rendszerbe integrálása jelenti. Az emberek által is sokszor nehezen megfogható fogalmi tudás reprezentálására egy hatékony megoldást kínál a megfelelő ontológia felhasználása [2]. A projekt egyik fő célja, hogy egy jól-definiált ontológia megalkotásával és felépítésével, illetve különböző dokumentum elemzési technikákkal való integrálásával (nyelvi elemző, indexelő és kereső, stb.) növelje meg a teljes információ beszerzési és kinyerési folyamat teljesítményét.

Egy másik mód arra, hogy az információ beszerzéshez hasznos tudást beépítsünk a rendszerbe az, hogy az emberek által végzett internetes dokumentum keresési és elemzési folyamatot modellezzük és a rendszer működését ennek megfelelően alakítjuk ki. A tervezett rendszer része egy autonóm dokumentum kereső és beszerző modul, amely az említett elven alapuló technikákat, illetve különböző internetes források tulajdonságának modellezését felhasználva végez hatékony dokumentum beszerzést a teljes rendszer számára [3].

Jelenleg a magyar IKF projekt keretében egy konkrét prototípus rendszer fejlesztése folyik, amely lehetőséget ad a különböző ötletek és megoldások implementálására valós alkalmazási környezetben.

 

[1]  EUREKA PROJECT "IKF - Information and Knowledge Fusion", March 2000.

[2]  N. Guarino, "Formal Ontology in Information Systems," In N.Guarino (ed.) Formal Ontology in Information Systems. Proceedings of FOIS'98, Trento, Italy, 6-8 June 1998. IOS Press, Amsterdam: 3-15.

[3]  P. Varga, T. Mészáros, Cs. Dezsényi, T.P. Dobrowiecki, "An Ontology-based Information Retrieval System", The 16th International Conference on Industrial & Engineering Applications of Artificial Intelligence and Expert Systems, Loughborough, UK, June 23-26, 2003.