Infobazy 2011 - streszczenia

Zintegrowany System Wiedzy
– platforma integracji systemów informacji naukowej

Cezary Mazurek, Krzysztof Sielski, Maciej Stroiński,
Justyna Walkowska, Marcin Werla, Jan Węglarz

Poznańskie Centrum Superkomputerowo-Sieciowe, ul. Noskowskiego 12/14, 61-704 Poznań

 

Zintegrowany System Wiedzy to nazwa systemu informatycznego, którego prototyp opracowywany jest przez Poznańskie Centrum Superkomputerowo-Sieciowe w ramach projektu SYNAT1. Głównym zadaniem tego systemu jest agregacja i udostępnienie danych z wielu rozproszonych i heterogenicznych systemów informacji naukowej. Docelowo działaniem sytemu objęte mają być zarówno systemy takie jak biblioteki czy muzea cyfrowe, w których informacjom opisowym (metadanym) towarzyszy cyfrowa reprezentacja obiektu, jak i systemy nie zawierające takich reprezentacji, takie jak na przykład biblioteczne systemy katalogowe czy bazy abstraktowe. Inną kategorię źródeł danych dla systemu mają stanowić usługi przechowujące dane źródłowe wysokiej jakości. Integracja danych w opracowywanym prototypie oparta jest na technologiach semantycznych i ontologii CIDOC CRM, a konkretnie jej implementacji Erlangen CRM.

W ramach niniejszego referatu przedstawiona zostanie koncepcja funkcjonalna systemu ZSW oraz projekt jego architektury. Omówiona zostanie też problematyka konstruowania bazy wiedzy, a w szczególności kwestie związane z agregacją i podstawową normalizacją danych oraz z ich dalszym przetwarzaniem do postaci semantycznej. Przedstawione zostaną również wyniki dotychczasowych prac związanych z rozwojem prototypu, obejmujące m.in. przetworzenie do postaci semantycznej metadanych próbki około 0.5 miliona obiektów pochodzących z Federacji Bibliotek Cyfrowych sieci PIONIER, zrealizowane m.in. z wykorzystaniem Centralnej Kartoteki Haseł Wzorcowych udostępnionej przez Centrum NUKAT.

 

1 Zadanie Badawcze SYNAT pt.:„Utworzenie uniwersalnej, otwartej, repozytoryjnej platformy hostingowej i komunikacyjnej dla sieciowych zasobów wiedzy dla nauki, edukacji i otwartego społeczeństwa wiedzy" jest częścią Program Strategicznego Narodowego Centrum Badań i Rozwoju noszącego nazwę: „Interdyscyplinarny system interaktywnej informacji naukowej i naukowo technicznej”. Projekt jest finansowany przez Narodowe Centrum Badań i Rozwoju, Nr Umowy SP/I/1/77065/10. Koordynatorem projektu jest ICM Uniwersytet Warszawski.