Baza Danych Fizykochemicznych i Termofizycznych (DaFiT) w Perspektywie Javy i Data Warehause

Andrzej Bylicki, Marcin Gorawski
Zakład Karbochemii PAN

Gliwice (tel.032-231-77-09)

W Bazie Danych Fizykochemicznych i Termofizycznych (w skrócie nazywana dalej bazą DaFiT) tworzonej w Zakładzie Karbochemii PAN we współpracy z Instytutem Chemii Fizycznej PAN i Thermodynamic Research Center of the Texas Univeristy w USA zgromadzono dane opisujące około 100 własności fizykochemicznych dla około 100 000 tysięcy substancji. Baza ta ( jedna z największych w świecie )jest dalej rozbudowywana w kierunku uzyskania kompletności dostępnych danych eksperymen-talnych obejmujących układy dwu- i trójskładnikowe w liczbie około 250 000. Własności fizykochemiczne układów bardziej złożonych jako funkcji parametrów stanu: temperatury, ciśnienia i składu stanowiących wielowymiarową przestrzeń praktycznie nie mogą być opisane przy pomocy zbiorów punktów uzyskanych w wyniku badań eksperymentalnych.
Jako jedyną możliwość rozwiązania tego zagadnienia i rozszerzenia wiedzy o fizykochemicznych własnościach wieloskładnikowych mieszanin substancji chemicznych mających największe znaczenie w technologiach chemicznych zastosowano metody obliczeniowe korelacji i predykcji danych oparte o teoretyczne modele z wykorzystaniem krytycznie ocenionych danych eksperymentalnych jako danych odniesienia służących do testowania zakresu zastosowań metod predykcji i wyznaczenia parametrów równań korelacyjnych i predykcyjnych.
O szerokości tego zagadnienia i konieczności przetwarzania i zarządzania bardzo licznymi zbiorami danych świadczy to, że liczba układów dwuskładnikowych tworzonych przez substancje wynosi ok. 1010, a opisanie 40 najważniejszych własności fizykochemicznych dla każdego układu jako funkcji parametrów stanu obejmuje 1014 danych.Liczba układów trójskładnikowych wynosi ok. 1015 i wzrasta w podobny sposób dla każdego kolejnego składnika mieszaniny.
Dla zastosowania metod obliczeniowych predykcji fizykochemicznych własności mieszanin opartych o modele teoretyczne konieczne jest wyróżnienie cech budowy chemicznej każdego z tworzących je związków na poziomie molekularnym wyrażających się w uporządkowaniu przestrzennym atomów, odległości atomowych, kątów, długości i charakterów wiązań, geometrycznej i elektronowej struktury cząsteczek oraz oddziaływań międzycząsteczkowych.
Podjęcie zadania utworzenia bazy danych fizykochemicznych własności mieszanin substancji organicznych jest pierwszą w świecie inicjatywą w tej dziedzinie opartą na zastosowaniu metod obliczeniowych przy pełnym wykorzystaniu dostępnych w literaturze danych eksperymentalnych i zastosowaniu nowoczesnych metod i procedur informatycznych.
Dla udostępnienia i wykorzystania zgromadzonych do tej pory danych bazy DaFiT w Internecie użyto platformy bazodanowej Oracle, Oracle WebServer i Developer/2000. . Cały system bazy DaFiT pracuje obecnie w heterogenicznym środowisku systemów SunOS - Solaris, MS Windows i Novell NetWare.
DAFIT to także bardzo rozbudowany, wielomodułowy system oprogramowania użytkowego -obecne prace informatyczne koncentrują się na wykorzystaniu technologii Javy i DataWarehause.
Integralną częścią serwisu WWW Bazy DAFIT jest moduł graficzny opracowany w języku Java, którego zadaniem jest prezentacja wyników eksperymentów przeprowadzonych na substancjach czystych - punktów pomiarowych i ich korelacji przy pomocy modeli równań matematycznych. Modele równań opisujące własności substancji czystych prezentowane są w postaci wykresów.
Moduł prezentacji graficznej wywoływany jest z dynamicznych stron WWW (tworzonych przy pomocy Oracle Web Server'a) prezentujących wszystkie dane dotyczące eksperymentu w postaci appletu. Moduł, oparty na metodach i modelach wynikających ze współczesnych osiągnięć termodynamiki, pozwala na krytyczną ocenę danych i ich interpretację.
Lawinowy wzrost liczby danych w układach wieloskładnikowych uzasadnia konieczność zastosowania technologii DataWarehause .Technologię tę analizuje się w kontekście wykorzystania przetwarzania analitycznego dla bazy DAFIT. Przedstawiono analizę porównawczą modeli MOLAP i ROLAP i wynikające stąd zalecenia dla procesu projektowania DW.