Niciun rezultat găsit

Căutarea dvs. nu a întors niciun rezultat

Ce este un depozit de date?

Un depozit de date este un tip de gestionare de date proiectat să permită şi să susţină activităţile de business intelligence (BI), în special pe cele de analiză. Depozitele de date sunt destinate exclusiv efectuării de interogări şi analize şi conţin adesea cantităţi mari de date din istoric. Datele dintr-un depozit de date provin de obicei dintr-o gamă largă de surse, cum ar fi fişierele jurnal ale aplicaţiilor şi aplicaţiile de tranzacţii.

Un depozit de date centralizează şi consolidează cantităţi mari de date din mai multe surse. Capacităţile sale analitice permit organizaţiilor să obţină informaţii de afaceri valoroase din datele lor pentru a îmbunătăţi procesul de luare a deciziilor. În timp, acesta construieşte un istoric ce poate fi extrem de valoros pentru experţii în date şi analiştii de afaceri. Datorită acestor capacităţi, un depozit de date poate fi considerat “singura sursă de adevăr a unei organizaţii.”

Un depozit de date obişnuit include adesea următoarele elemente:

  • O bază de date relaţională pentru a stoca şi a gestiona datele
  • O soluţie de extragere, încărcare şi transformare (ELT) pentru pregătirea datelor pentru analiză
  • Capacităţi de analiză statistică, raportare şi extragere a datelor
  • Instrumente de analiză a clientului pentru vizualizarea şi prezentarea datelor către utilizatorii business
  • Alte aplicaţii analitice mai sofisticate care generează informaţii
  • pe baza cărora se pot efectua acţiuni, prin aplicarea algoritmilor de învăţare asistată de computer şi inteligenţă artificială (AI)

De ce să nu executaţi analize împotriva mediului OLTP?

Depozitele de date sunt medii relaţionale utilizate pentru analiza datelor, în special a datelor din istoric. Organizaţiile folosesc depozitele de date pentru a descoperi modele şi relaţii în datele lor, care se dezvoltă în timp.

În schimb, mediile tranzacţionale sunt folosite pentru a procesa tranzacţiile în mod continuu şi sunt utilizate în mod obişnuit pentru introducerea comenzilor, tranzacţiile financiare şi cele de retail. Acestea nu se bazează pe datele din istoric; de fapt, în mediile OLTP, datele din istoric sunt adesea arhivate sau pur şi simplu eliminate pentru îmbunătăţirea performanţei.

Depozitele de date şi sistemele OLTP diferă semnificativ.

Depozitul de date Sistemul OLTP
Fluxul de lucru Gestionează întrebările ad-hoc şi analiza datelor Acceptă numai operaţii predefinite
Modificările datelor Se actualizează automat în mod regulat Actualizări de către utilizatorii finali care emit declaraţii individuale
Designul schemelor Utilizează scheme parţial denormalizate pentru a optimiza performanţa Utilizează scheme complet normalizate pentru a garanta consecvenţa datelor
Scanarea datelor Cuprinde mii până la milioane de rânduri Accesează doar câteva înregistrări în acelaşi timp
Datele din istoric Stochează mai multe luni sau ani de date Stochează date doar pentru săptămâni sau luni

Depozitele de date, pieţele de date şi magazinele de date operaţionale

Deşi execută roluri similare, depozitele de date sunt diferite de pieţele de date şi de magazinele de date operaţionale (ODS). O piaţă de date îndeplineşte aceleaşi funcţii ca un depozit de date, dar într-un domeniu mult mai limitat, de obicei un singur departament sau o singură linie de afaceri. Datorită acestui lucru, pieţele de date sunt mai uşor de stabilit decât depozitele de date. Cu toate acestea, ele tind să introducă inconsecvenţe, deoarece poate fi dificil să gestionaţi şi să controlaţi în mod uniform datele în mai multe pieţe de date.

ODS acceptă numai operaţiunile zilnice, de aceea, vizualizarea datelor din istoric este foarte limitată. Deşi funcţionează foarte bine ca surse de date curente şi sunt deseori folosite ca atare de către depozitele de date, ele nu acceptă interogări complexe ale datelor din istoric.

Am nevoie de un lac de date?

Organizaţiile folosesc atât lacuri de date, cât şi depozite de date pentru volume mari de date din diferite surse. Opţiunea de a utiliza oricare dintre acestea depinde de ceea ce intenţionează organizaţia să facă cu datele. În continuare se prezintă modul în care fiecare opţiune este folosită în mod optim:

  • Lacurile de date stochează din abundenţă date disparate, nefiltrate pentru a fi utilizate ulterior pentru un anumit scop. Datele din aplicaţiile pentru liniile de afaceri, din aplicaţiile mobile, dispozitivele de socializare, dispozitivele IoT şi din multe alte surse sunt captate ca date brute într-un lac de date. Structura, integritatea, selecţia şi formatul diferitelor seturi de date sunt stabilite în momentul analizei de către persoana care efectuează analiza. Lacul de date ar putea fi alegerea corectă atunci când organizaţiile au nevoie de stocare cu costuri reduse pentru date neformatate, nestructurate din surse multiple, pe care intenţionează să le utilizeze pentru un anumit scop în viitor.
  • Depozitele de date sunt destinate în mod special analizei datelor. Procesarea analitică într-un depozit de date se realizează cu date care au fost pregătite pentru analiză — adunate, contextualizate şi transformate — cu scopul de a genera informaţii pe bază de analiză. Depozitele de date sunt, de asemenea, potrivite pentru de a gestiona cantităţi mari de date din diverse surse. Depozitul de date este probabil alegerea corectă atunci când organizaţiile au nevoie de analize avansate de date sau de analize care se bazează pe datele din istoric din mai multe surse din întreaga întreprindere.

Beneficiile unui depozit de date

Depozitele de date oferă beneficiul fundamental şi unic de a permite organizaţiilor să analizeze cantităţi mari de date variate şi să extragă valoare semnificativă din acestea, precum şi să păstreze o evidenţă a datelor din istoric.

Patru caracteristici unice (descrise de informaticianul William Inmon, care este considerat întemeietorul depozitului de date) permit depozitelor de date să ofere acest beneficiu fundamental. Conform acestei definiţii, depozitele de date sunt

  • Axate pe subiect. Acestea pot analiza date despre un anumit subiect sau domeniu funcţional (cum ar fi vânzările).
  • Integrate. Depozitele de date creează consecvenţă între diverse tipuri de date din surse diferite.
  • Nevolatile. Odată ce datele se află într-un depozit de date, acestea sunt stabile şi nu se schimbă.
  • Dependente de timp. Analiza depozitului de date ia în calcul modificările realizate în timp.

Un depozit de date bine conceput va efectua interogări foarte rapid, va furniza o cantitate mare de date şi va oferi flexibilitate suficientă pentru ca utilizatorii finali “să dividă” sau să reducă volumul de date pentru o examinare mai detaliată, cu scopul de a satisface o gamă variată de cerinţe — fie la nivel înalt, fie la nivel foarte fin şi detaliat. Depozitul de date serveşte drept bază funcţională pentru mediile BI middleware, care oferă utilizatorilor finali rapoarte, tablouri de bord şi alte interfeţe.

Arhitectura depozitului de date

Arhitectura unui depozit de date este determinată de nevoile specifice ale organizaţiei. Arhitecturile obişnuite includ

  • Simplu. Toate depozitele de date au un design de bază în care metadatele, datele rezumative şi datele brute sunt stocate în colecţia centrală a depozitului. Colecţia este alimentată de surse de date la un capăt şi accesată de utilizatorii finali pentru analiză, raportare şi exploatare la celălalt capăt.
  • Simplu cu o zonă de aşteptare. Datele operaţionale trebuie curăţate şi procesate înainte de a fi introduse în depozit. Deşi acest lucru se poate face în mod programat, multe depozite de date adaugă o zonă de aşteptare pentru date înainte ca acestea să intre în depozit, pentru a simplifica pregătirea datelor.
  • Centru şi etape. Prin adăugarea pieţelor de date între colecţia centrală şi utilizatorii finali, organizaţia poate să îşi personalizeze depozitul de date pentru a deservi diverse linii de afaceri. Când datele sunt gata de utilizare, acestea sunt mutate în piaţa de date corespunzătoare.
  • Medii de testare. Mediile de testare sunt zone private şi sigure, în care companiile pot să exploreze rapid şi neoficial noi seturi de date sau modalităţi de analiză a datelor fără a trebui să respecte regulile şi protocolul depozitului de date.

Evoluţia depozitelor de date — De la analiza de date la AI şi învăţarea asistată de computer

Când au apărut depozitele de date la sfârşitul anilor 1980, scopul lor era de a ajuta trecerea fluxului de date din sistemele operaţionale către sistemele de susţinere a deciziilor (DSS). Primele depozite de date necesitau o cantitate enormă de date redundante. Majoritatea organizaţiilor aveau mai multe medii DSS care deserveau diverşi utilizatori. Deşi mediile DSS foloseau o mare parte din aceleaşi date, colectarea, curăţarea şi integrarea datelor se repetau adesea pentru fiecare mediu.

Dat fiind că depozitele de date au devenit tot mai eficiente, ele au evoluat de la stadiul de magazine de informaţii, care susţineau platformele BI tradiţionale, transformându-se în ample infrastructuri de analiză, care susţin o gamă largă de aplicaţii, cum ar fi analizele operaţionale şi managementul performanţelor.

Repetiţiile depozitului de date au progresat de-a lungul timpului pentru a furniza valoare suplimentară graduală întreprinderii.

Etapă Capacitate Valoarea pentru afaceri
1 Raportarea tranzacţiilor Oferă informaţii relaţionale pentru a crea analize instantanee ale performanţei afacerii
2 Divizare, interogare ad hoc, instrumente BI Extinde capacităţile pentru a obţine informaţii mai profunde şi analize mai puternice
3 Anticipează performanţele viitoare (exploatarea datelor) Dezvoltă vizualizări şi inteligenţă de afaceri pentru viitor
4 Analiză tactică (spaţială, statistică) Oferă scenarii de tipul “ce-ar fi dacă” pentru a fundamenta deciziile practice pe baza unei analize mai complexe
5 Stochează mai multe luni sau ani de date Stochează date doar pentru săptămâni sau luni

Pentru fiecare dintre aceste cinci etape era nevoie de o varietate tot mai mare de seturi de date. Ultimele trei etape, în special, creează necesitatea unei game şi mai ample de date şi de capacităţi de analiză.

În prezent, AI şi învăţarea asistată de computer transformă aproape toate activele din industrii, servicii şi întreprinderi, iar depozitele de date nu fac excepţie. Extinderea Big Data şi aplicarea noilor tehnologii digitale determină schimbarea cerinţelor şi capacităţilor depozitelor de date.

Depozitul de date autonom reprezintă ultima etapă din această evoluţie, oferind întreprinderilor posibilitatea de a extrage şi mai multă valoare din datele lor, reducând în acelaşi timp costurile şi îmbunătăţind fiabilitatea şi performanţa depozitului de date.

Aflaţi mai multe despre depozitele de date autonome în ebookul nostru şi apoi începeţi cu propriul dvs. depozit de date autonom.

Proiectarea unui depozit de date

Dacă o organizaţie doreşte să proiecteze un depozit de date, trebuie să înceapă prin definirea cerinţelor sale specifice de afaceri, stabilind domeniul de aplicare şi elaborând un proiect conceptual. Organizaţia poate apoi crea atât designul logic, cât şi pe cel fizic pentru depozitul de date. Designul logic implică relaţiile dintre obiecte, iar designul fizic înseamnă cea mai bună modalitate de a stoca şi de a recupera obiectele. Designul fizic include, de asemenea, procesele de transport, de rezervă şi de recuperare.

Orice proiect de depozit de date trebuie să abordeze următoarele aspecte:

  • Conţinutul de date specific
  • Relaţiile în cadrul şi între grupurile de date
  • Mediul sistemelor care va susţine depozitul de date
  • Tipurile de transformări de date necesare
  • Frecvenţa de actualizare a datelor

Un factor principal în etapa de proiectare constă în nevoile utilizatorilor finali. Majoritatea utilizatorilor finali sunt interesaţi să efectueze analize şi să examineze datele în mod agregat, nu sub formă de tranzacţii individuale. Cu toate acestea, utilizatorii finali adesea nu ştiu cu adevărat ce doresc până când nu apare o anumită nevoie. De aceea, procesul de planificare ar trebui să includă un proces de explorare suficient de amplu pentru a anticipa nevoile. În cele din urmă, designul depozitului de date ar trebui să permită spaţiu de expansiune şi dezvoltare pentru a ţine pasul cu evoluţia nevoilor utilizatorilor finali.

Cloudul şi depozitul de date

Depozitele de date din cloud oferă aceleaşi caracteristici şi beneficii ca depozitele de date on-premises, însă au avantajele adăugate ale tehnologiei de cloud computing, cum ar fi flexibilitatea, scalabilitatea, agilitatea, securitatea şi costurile reduse. Depozitele de date în cloud permit întreprinderilor să se concentreze exclusiv asupra extragerii de informaţii valoroase din datele lor, în loc să fie nevoite să construiască şi să gestioneze infrastructura hardware şi software pentru a susţine depozitul de date.

Citiţi despre Oracle Cloud şi despre depozitele de date (PDF)

Implementarea cu complexitate zero: depozitul de date autonom

Cea mai recentă iteraţie a depozitului de date este depozitul de date autonom, care se bazează pe AI şi învăţarea asistată de computer pentru a elimina sarcinile manuale şi pentru a simplifica configurarea, implementarea şi gestionarea datelor. Un depozit de date autonom ca serviciu în cloud nu necesită administrarea bazei de date, configurarea sau gestionarea hardware-ului ori instalarea software-ului prin intervenţii umane.

Crearea depozitului de date, copierea de rezervă, remedierea şi actualizarea bazei de date, precum şi extinderea sau reducerea acesteia se efectuează automat — cu aceeaşi flexibilitate, scalabilitate, agilitate şi costuri reduse pe care le asigură platformele în cloud. Depozitul de date autonom elimină complexitatea, accelerează implementarea şi eliberează resursele, astfel încât organizaţiile să se poată concentra pe activităţile care aduc plus de valoare afacerii.

Depozitul de date autonom Oracle

Depozitul de date autonom Oracle este un depozit de date complet autonom, uşor de utilizat, scalabil, care asigură rezultate rapide la interogări şi nu necesită administrarea bazei de date. Depozitul de date autonom Oracle este foarte simplu şi rapid de configurat.

Aflaţi mai multe despre Depozitul de date autonom Oracle (PDF)