Data Warehousing
Předmětem data warehousingu je návrh systémů
pro analýzy dat založených na principu vytvoření jednotného obrazu firmy
obsahujícím data integrovaná ze všech informačních zdrojů, historická,
detailní a transformovaná do tvaru vhodném pro analýzy.
Systém má pak následující strukturu:
Zdroje dat
Zdroji dat jsou provozní systémy, např. ERP (účetnictví
sklady, logistika, výroba), CRM (marketing, prodej, servis), specializovaných
systémů (bankovní systémy, systémy řízení mobilní sítě, fakturační systémy,
systémy technologického řízení výroby a pod.), WWW (údaje o zobrazovaných
či zadaných informacích) a externí zdroje dat v elektronické formě (výsledky
průzkumů, obchodní rejstřík, elektronické burzy, výstupy informačních
agentur a pod.).
Pracovní oblast - Staging
Area
Ze zdrojových systémů jsou data přenášena do pracovní
oblasti. Zde jsou data čištěna a postupně transformována do struktur datového
skladu. V pracovní oblasti mohou být data uložena dočasně nebo i delší
časové období.
Datový sklad - Data Warehouse
Základním účelem datového skladu je uložení integrovaných,
historických, náležitě vyčištěných dat, tak aby co nejpřesněji obrážela
stav firmy nyní i v minulosti. Tomu odpovídá jeho datová struktura. Datový
sklad je "jedním zdrojem pravdy" pro celou firmu a stále se rozvíjí, aby
ji mohl zachycovat, i když se firma sama o sobě mění. Do datového skladu
mohou přímo přistupovat uživatelé pomocí nástrojů pro reporting a dotazování.
Datová tržiště - Data Marts
Datová tržiště jsou určena k tomu, aby různé skupiny
uživatelů co nejjednodušším způsobem získali informaci, kterou potřebují.
Tomuto požadavku je zcela podřízena jejich datová struktura i nástroje
pro přístup k nim. Datová tržiště jsou přitom plněna kvalitními daty z
datového skladu. Mohou vznikat a zanikat, tak jak vznikají a zanikají
specifické potřeby uživatelů na analýzu dat. Datová tržiště mohou být
různých typů.
- ROLAP / MOLAP tržiště umožňují uživatelům pohled na
číselné údaje (tzv. fakta) z různých úhlů pohledu (tzv. dimenzí) různých
úrovní sumace (tzv. hierarchie). Základem je technologie uložení dat
buď ve star schematu nebo v multidimenzionálních kostkách.
- Data miningová tržiště mají strukturu přizpůsobenou
specifickým požadavkům data miningových metod. Výsledky data miningových
analýz mohou být přenášeny zpět do datového skladu. Typickém příkladem
analýzy je možnost křížového prodeje dalších produktů, pravděpodobnost
odchodu ke konkurenci, pravděpodobnost zpronevěry pro každého zákazníka,
pravděpodobnost odpovědi na určitou marketingovou kampaň a pod.
- Datová tržiště mohou využívat i běžnou databázi
a tak k nim mohou uživatelé přistupovat pomocí nástrojů pro reportingu
a dotazování.
- Mohou být dokonce tvořena aplikací, která
dále s daty manipuluje a do které jsou další data, většinou různé parametry,
koeficienty a pravidla, zadávány. Příkladem jsou aplikace, které jsou
na základě údajů z datového skladu a dalších dodaných údajů schopny
spočítat ziskovost nebo rizikovost až na úroveň jednoho zákazníka. Výsledky
z aplikací mohou být přenášeny zpět do datového skladu.
Na výše uvedené struktury navazují jednotlivé kroky
analýzy dat.
|
| |
|