Komponenty pro analýzu dat

Oracle pokrývá svými produkty všechny potřeby vývoje a provozu řešení pro analýzu dat. Díky tomu je požadovaná funkcionalita optimálně rozložena mezi komponenty a použité prostředky jsou maximálně efektivně využity. Jednotlivé komponenty jsou přitom úzce integrovány, díky čemuž se zjednodušuje a zrychluje vývoj řešení a klesají nároky na jeho provoz. Rozložení komponent do vrstev infrastruktury a jednotlivých kroků analýzy dat je následující:

Přenosy dat - ETL Proces a EAI a správa metadat Základní analýzy - Reporty a dotazování Pokročilé analýzy - MOLAP a Data Mining
Oracle Database Databáze Oracle dokáže zajistit výkon celého ETL procesu, tedy načtení dat ze zdrojových systémů, jejich transformace do podoby vhodné pro analýzy (reporting, dotazování, pokročilé analýzy) a jejich uložení do databáze.

Při požadavcích na real-time přenosy dat se využívá pro příjem, zpracování a odesílaní zpráv vlastnost databáze Oracle Advanced Queing.

Databáze zajistí i plánované spouštění jednotlivých úloh a správnou posloupnost všech kroků ETL a EAI procesů - workflow.

Databáze Oracle podporuje analýzu dat přímo v databázi speciálními vlastnostmi pro vysoký výkon při dotazování nad velkými objemy dat (správa sumarizací - Materialized Views atd.) a pro zodpovídání dotazů, které klasická relační databází neumí odpovědět a přitom jsou často používané v běžné praxi (analytické funkce - Analytic functions).

Tyto vlastnosti pak plně využívají nástroje Oracle pro reporting, dotazování a pokročilé analýzy.

Pokročilé OLAP analýzy zahrnující modelování výpočty pokročilých analytických funkcí (např. předpovědi) zajišťuje multidimenzionální úložiště a kalkulační engine, které jsou k dispozici jako rozšíření relační databáze OLAP Option. K datům v MOLAP úložišti lze díky unikátní technologii přístupovat libovolným reportingovým či analytickým nástrojem využívajícím jazyk SQL nebo nativně pomocí OLAP API.

Data-miningové algoritmy jsou dispozici jako rozšíření databáze Data Mining Option. Díky tomu, že jsou implementovány přímo v databázi, výrazně zjednodušuje a zrychluje manipulace s velkými objemy dat. K dispozici je rozhraní, díky kterému lze data mining snadno integrovat do libovolných aplikací a použít je při analýze dat v datovém skladu.

Oracle Business Intelligence Server Součástí balíku jsou nástroje pro distribuci předpřipravených reportů a dotazování. Tyto nástroje jsou použity pro přístup k metadatům popisujícím datový sklad a ETL proces a monitorování průběhu ETL procesu (součást Warehouse Builderu. Součástí balíku jsou nástroje pro distribuci předpřipravených reportů uživatelům Reports Services, Discoverer Viewer a pro dotazování uživatelů nad daty v relační databázi (označováno jako ROLAP analýzy) Discoverer Plus s připojením k relačnímu úložišti.

Díky tomu, že relační databáze Oracle obsahuje přímou podporu pro analýzy dat (viz. výše), dokáží tyto nástroje pokrýt velký počet požadavků na analýzu dat.

Tyto nástroje jsou použity i pro přístup k  metadatům a k monitorování průběhu ETL a EAI procesů.

Pro pokročilé MOLAP analýzy slouží Oracle Discoverer Plus s připojením k multidimenzionálnímu úložišti. Nebo Oracle Spreadsheet Add-In – rozšíření funkcionality MS Excel. Ale také lze využít Discoverer Viewer či Reports Services pro distribuci multidimenzionálních analýz.
Oracle Business Intelligence Tools Součástí balíku je nástroj pro návrh a správu datových skladů a procesu jeho plnění (ETL proces) Warehouse Builder úzce navazující na komponenty databáze zajišťující výkon celého ETL procesu. V nástroji je zahrnuto i propojení na SAP (SAP Integrator) a mainframe (Pure Extract) a podpora čištění zákaznických dat (Pure Integrate). Balík obsahuje nástroj pro návrh reportů Reports Builder a administrátorskou část nástroje pro dotazování Discoverer Administration Edition. V obou případech jsou využity speciální vlastnosti databáze pro reporting a dotazování. Součástí balíku je vývojové prostředí pro Javu JDeveloper sloužící spolu s knihovnami Oracle Business Intelligence Beans pro vývoj analytických aplikací nad multidimenzionálním úložištěm.

Stejně tak lze v JDeveloperu vyvíjet aplikace využívajících data mimingové algoritmy implementované v databázi.

E-mail this page