Digitalizált szövegek XML-alapú feldolgozása a W3C legújabb ajánlásaival

 

A Neumann János Digitális Könyvtár és Multimédia Központ vezető szerepet tölt be a magyar kulturális örökség digitalizálásában. A könyvtár nagy múltra tekint vissza az SGML alapú szöveg-feldolgozási technológia alkalmazásában.

 

A világhálót működtető szabványokat kidolgozó szervezetek közül a World Wide Web Consortium (W3C) ajánlásait tekintjük iránymutatónak.

 

Legújabb digitalizálási projektjeink már túlmutatnak az egyszerű SGML alapú szövegfeldolgozáson, a feldolgozásra kerülő anyagokban már matematikai egyenletek, képletek, ábrák is szerepelnek.

 

Ezekben a speciális esetekben is a W3C legfrissebb ajánlásait követjük: a matematikai részekhez a MathML (Mathematical Markup Language) leírónyelvet, a méretezhető ábrák elkészítéséhez pedig az SVG (Scalable Vector Graphics) XML-alapú nyelvet használjuk.

 

A közeljövőben azt tervezzük, hogy a teljes SGML-re épülő szöveg-feldolgozási munkafolyamatot átszervezzük, és egy hatékonyabb, XML alapú rendszert dolgozunk ki.

 

A szövegfeldolgozáshoz kapcsolódó K+F munkát és annak eredményeit szeretném bemutatni előadásomban.

 

Tematika:

 

1. SGML alapú szövegfeldolgozás a Neumann-házban

 

2. Új igények és lehetőségek: a W3C ajánlásai

-         A régi módszer: matematikai egyenletek képként (GIF, JPG, PNG)

-         Az új módszer: a MathML alkalmazása

-         Alternatív lehetőségek: matematikai egyenletek méretezhető képként (SVG)

 

3. K+F tapasztalatok, a fejlesztés új irányai

 

 

 

Budapest, 2003. január 6.

 

 

 

Kora András

Neumann János Digitális Könyvtár és Multimédia Központ Kht.