Data Lake

Un data lake este un depozit de date structurate, semistructurate și nestructurate, în orice format și dimensiune și la orice scară, care pot fi analizate cu ușurință. Cu Oracle Cloud Infrastructure (OCI), puteți construi un data lake sigur, rentabil și ușor de administrat. Un data lake pe OCI este integrat îndeaproape cu depozitele de date și cu analizele preferate, precum și cu alte servicii OCI, cum ar fi catalogul de date, securitatea și serviciile de monitorizare.

Ce este un data lake? (0:44)
Orice date, orice sursă

Transferați-vă datele în loturi sau fluxuri neîntrerupte către un data lake OCI, unde acestea pot fi analizate. Utilizați OCI Data Integration, OCI GoldenGate sau OCI Streaming pentru a vă colecta datele și a le stoca în OCI Object Storage.

Adio, silozuri de date!

Un centru de date principal pe OCI se integrează cu instrumentele dvs. preferate, inclusiv cu baze de date precum Oracle Autonomous Data Warehouse, MySQL HeatWave, instrumente de analiză și de machine learning (ML), cum ar fi Oracle Analytics Cloud, și cu proiecte open source precum Apache Spark.

Utilizați AI și ML

Un set cuprinzător de servicii AI și ML vă permite să obțineți informații noi pe baza datelor dvs., să faceți predicții, să reduceți cheltuielile operaționale și să îmbunătățiți experiența clienților.

Descoperiți și securizați-vă datele

Catalogați-vă datele și colectați informații despre data lake cu OCI Data Catalog. Activați instrumentele de interogare și bazele de date pentru a descoperi și interoga datele în depozitul de obiecte.

Obțineți acces anticipat la OCI Data Lake

Oracle Cloud Infrastructure lansează anul acesta un serviciu pentru depozitarea datelor gestionat integral, denumit OCI Data Lake. Vă puteți înregistra din timp, pentru a explora caracteristicile și capacitățile sale înainte de lansarea oficială.

De ce să utilizați un data lake pe OCI?


Modernizați-vă data lake

Un data lake permite lucrul cu mai multe tipuri de date, dar timpul și efortul necesar pentru administrarea acestora pot fi contraproductive. Oferind servicii de tip data lake open source complet automatizate, OCI asigură atât costuri mai mici, dar și mai puțin efort de management, astfel încât vă puteți aștepta la costuri operaționale reduse, la o scalabilitate și securitate îmbunătățite și la posibilitatea de a încorpora toate datele actuale într-un singur loc.


Extindeți-vă depozitul de date

Depozitele de date și datamarturile sunt esențiale pentru afacerile de succes. Integrarea acestora cu un data lake le va crește și mai mult valoarea. Integrarea între bazele de date, depozitele de date și un data lake cu Oracle înseamnă că datele pot fi accesate din mai multe locații cu o singură interogare SQL. Aplicațiile și instrumentele actuale beneficiază de acces transparent la toate datele, fără modificări și fără a fi nevoie să dobândiți noi competențe.


Utilizați analize avansate pentru aplicațiile Oracle

Datele generate de aplicațiile întreprinderii sunt extrem de valoroase, dar rareori sunt utilizate pe deplin. Un data lake pe OCI simplifică accesul la date provenite din mai multe aplicații și permite efectuarea de analize sofisticate, care pot constitui o diferență semnificativă între un trimestru bun și unul slab.

Soluție integrată Data Lake în OCI

Centralizați-vă datele cu o experiență OCI Data Integration integrată.

Interogați date din orice sursă fără replicare.

Aplicații preintegrate, care oferă valoare instantanee.

Catalogați și guvernați date cu o experiență integrată în OCI Data Catalog.

Securizați-vă datele cu politici de control al accesului detaliate, bazate pe roluri.

Platforma de date Oracle deblochează întregul potențial al datelor dvs.

  • Combinați datele tranzacționale și analitice – evitați silozurile.
  • Utilizați Oracle IaaS sau Oracle SaaS, sau orice altceva între cele două – alegeți nivelul de control dorit.
  • Aduceți orice tip de date pe platformă – noi desființăm bariera dintre datele structurate și cele nestructurate.
  • Explorați forța OCI și deschiderea sa față de alți furnizori de servicii cloud - vă venim în întâmpinare acolo unde vă aflați.
  • Utilizați raportarea de top Oracle Analytics Cloud sau orice altă aplicație analitică terță parte – OCI are caracter deschis.
Schemă de prezentare generală a platformei de date Oracle, descrierea mai jos Diagrama prezintă platforma de date Oracle cu sursele de date, serviciile de circulație a datelor, cum ar fi serviciile de integrare, nucleul platformei de date moderne Oracle și posibilele rezultate și servicii de dezvoltare a aplicațiilor.

Integrați Autonomous Database cu data lake-urile

Oracle Autonomous Database suportă integrarea cu data lake-uri - nu doar pe Oracle Cloud Infrastructure, ci și pe Amazon Web Services (AWS), Microsoft Azure, Google Cloud și multe altele. Aveți posibilitatea de a încărca datele în baza de date sau de a interoga datele direct în magazinul de obiecte sursă. Ambele abordări utilizează aceleași instrumente și API-uri pentru a accesa datele.

Această arhitectură se numește uneori arhitectură de tip lakehouse.



Autonomous Database cu schema pentru data lake-uri, descriere mai jos Schema prezintă o arhitectură a unei platforme de date care utilizează Oracle Autonomous Database, cu surse de date, Oracle Autonomous Database și rezultatele aferente.

Analize în timp real pentru toate datele dvs. cu MySQL HeatWave Lakehouse

Un serviciu de baze de date în cloud MySQL pentru tranzacții, analize în timp real în depozite de date și lacuri de date și machine learning – fără complexitatea, latența, riscurile și costul duplicării ETL.



Autonomous Database cu schema pentru data lake-uri, descriere mai jos Schema prezintă o arhitectură a unei platforme de date care utilizează Oracle MySQL HeatWave, cu surse de date, MySQL Heatwave și rezultatele aferente.

Construiți un data lake cu servicii open source administrate de Oracle

Creați rapid data lake-uri bazate pe Hadoop sau Spark pentru a vă extinde depozitele de date și pentru a vă asigura că toate datele sunt în același timp ușor accesibile și gestionate în mod rentabil.



Autonomous Database cu schema pentru data lake-uri, descriere mai jos Schema prezintă o arhitectură a unei platforme de date care utilizează servicii open source gestionate de Oracle, cum ar fi Hadoop, Spark și OpenSearch, cu surse de date, servicii open source Oracle în centrul acestora și eventualele rezultate.

Servicii data lake de la Oracle

Deplasarea și integrarea datelor

Conectați și extindeți aplicațiile analitice cu date tranzacționale consistente în timp real, cu sarcini de loturi eficiente și cu date în flux continuu.

  • OCI Data Integration
    Simplificați procesele complexe de extragere, transformare și încărcare a datelor (ETL/E-LT) în data lakes și depozite de date pentru știința și analiza datelor cu ajutorul unui creator de fluxuri de date fără cod.
  • Oracle Data Integrator
    Data Integrator oferă o migrare avansată a datelor pentru extragerea, transformarea și încărcarea acestora. Oracle Data Integrator este optimizat pentru bazele de date în cloud Oracle, precum și pentru bazele de date locale.
  • Oracle GoldenGate
    Oracle GoldenGate permite disponibilitate ridicată, integrarea datelor în timp real, captarea datelor de conversie, replicarea datelor, transformările și verificările între sistemele operaționale și analitice de tip entreprise.
  • OCI Streaming
    Streaming oferă integrări imediate pentru sute de produse de la terți din categorii precum DevOps, baze de date, big data și aplicații SaaS.

Data lake

Construiți un data lake folosind servicii de date complet automatizate, cu costuri mai mici și cu mai puțin efort.

  • OCI Data Lake
    Data Lake oferă spațiu de stocare centralizat și metadate pentru datele structurate și nestructurate, cu un control al accesului unificat și minuțios.
  • OCI Object Storage
    Object Storage le permite clienților să stocheze orice tip de date în formatul lor nativ. Acest aspect este ideal pentru crearea de aplicații moderne care necesită amploare și flexibilitate.
  • OCI Data Catalog
    Data Catalog îi ajută pe profesioniștii în domeniul datelor din întreaga organizație să caute, să exploreze și să administreze datele utilizând un inventar al activelor de date la nivelul întregii organizații.
  • OCI Data Flow
    Data Flow este un serviciu Apache Spark complet automatizat care permite efectuarea de sarcini de procesare pe seturi de date extrem de mari, fără a fi nevoie de implementarea sau managementul infrastructurii. Acest aspect permite livrarea rapidă a aplicațiilor, deoarece dezvoltatorii se pot concentra pe dezvoltarea aplicațiilor, nu pe managementul infrastructurii.
  • Oracle Big Data
    Big Data Service este un serviciu de data lake bazat pe Hadoop care permite stocarea și analizarea unor cantități mari de date brute ale clienților. Fiind un serviciu gestionat, Oracle Big Data Service vine cu o stivă complet integrată care include atât instrumente open source, cât și instrumente Oracle cu valoare adăugată, simplificându-vă operațiunile IT.

Data lakehouse

Valorificați integrarea OCI a data lake-urilor dvs. cu depozitele de date preferate și descoperiți noi perspective.

  • MySQL Heatwave Lakehouse
    MySQL HeatWave Lakehouse se conectează în mod transparent la data lake-uri, permițându-le utilizatorilor să proceseze și să interogheze sute de terabiți de date din stocul de obiecte într-o varietate de formate de fișiere, inclusiv CSV, Parquet și în copii de rezervă Aurora/Redshift.
  • Funcții Autonomous Database lakehouse
    Autonomous Database permite accesul liber la un data lake, dându-le utilizatorilor posibilitatea să încarce sau să interogheze direct fișiere în toate magazinele de obiecte (inclusiv OCI, AWS, Azure și Google Cloud Platform). Analizele integrate de tip machine learning, spațiale, de text și grafice permit obținerea de informații fără necesitatea de a transfera date.

AI și machine learning

Obțineți informații din date cu modele de inteligență artificială predefinite sau creați-vă propriile modele.

  • OCI AI Services
    AI Services reprezintă o colecție de servicii cu modele predefinite de machine learning, care facilitează aplicarea inteligenței artificiale în aplicații și operațiuni de afaceri de către dezvoltatori. Modelele pot fi antrenate în mod personalizat pentru rezultate de afaceri mai precise.
  • OCI Data Science
    Construiți, antrenați, implementați și gestionați rapid modele de machine learning cu un serviciu de știință a datelor creat pentru echipe.
  • Machine Learning în Oracle Database
    Machine Learning în Oracle Database susține procesele de explorare și pregătire a datelor și de modelare a proceselor de machine learning la scară largă.
  • MySQL HeatWave AutoML
    MySQL HeatWave AutoML include tot ce au nevoie utilizatorii pentru a construi, instrui, implementa și explica modelele de machine learning în MySQL HeatWave, fără costuri suplimentare.
Servicii financiare
Experian accelerează inclusivitatea financiară cu un data lakehouse pe OCI.
Exploatare de date
MineSense a obținut interogări de 5 ori mai rapide cu un lakehouse pe OCI.
Publicitate
Beso a unificat datele din 23 de surse online, cu o varietate de surse offline pentru a crea un data lake care se va extinde la 100 de surse.
Tehnologie pentru sport
Cu un data lakehouse de la Oracle, Seattle Sounders administrează de 100 de ori mai multe date, generează informații de 10 ori mai rapid și a simplificat managementul bazelor de date.

Ecosistemul partenerilor Data Lakehouse

Soluțiile pentru partenerii Oracle utilizează și extind sistemele data lakehouse din OCI.

  • Sigla Accenture
  • sigla Capgemini
  • Sigla Deloitte
  • sigla h2o.ai
  • sigla qubix
  • sigla Reply Technology
  • sigla Sesame Software
  • sigla wandisco

Informatica este partenerul preferat pentru integrarea și guvernanța datelor pentru soluțiile de data warehouse și lakehouse.

Adoptarea unui data lake pe Oracle Cloud Infrastructure

Vedeți toate arhitecturile de referință
Seria Oracle Playbook

Am compilat secretele Oracle legate de strategia privind oamenii, procesele și sistemele. Și dorim să le împărtășim cu dvs.

Începeți să utilizați un data lake pe OCI

Încercați serviciile în cloud întotdeauna gratuite și veți primi o versiune de încercare de 30 de zile

Oracle oferă un nivel gratuit, fără limită de timp, pentru o serie de servicii, inclusiv Autonomous Data Warehouse, OCI Compute și produsele Oracle Storage, precum și credite gratuite în valoare de 300 USD pentru a testa servicii cloud suplimentare. Obțineți detaliile și înscrieți-vă astăzi pentru contul dvs. gratuit.

  • Ce este inclus în Oracle Cloud Free Tier?

    • Întotdeauna gratuite
    • 2 baze de date autonome, de 20 GB fiecare
    • VM pentru calcul
    • Bloc cu volum de 100 GB
    • 10 GB spațiu de stocare obiecte

Învățați în cadrul laboratoarelor noastre practice

Cel mai bun mod de a învăța este să experimentați personal. Încercați acest workshop gratuit despre un data lake, care demonstrează un scenariu tipic de utilizare și evidențiază unele dintre instrumentele pe care le puteți folosi pentru a construi un data lake.

  • Accesați data lake utilizând Autonomous Database și Data Catalog

    Laboratoarele din acest atelier vă explică pașii pe care trebuie să îi parcurgeți pentru a accesa un data lake creat cu Oracle Object Storage buckets utilizând Oracle Autonomous Database și OCI Data Catalog.

    Începeți să utilizați laboratorul de acces la data lake
  • Începeți să utilizați Oracle Big Data Service

    Aflați cum puteți să creați și să monitorizați un cluster Hadoop cu disponibilitate ridicată utilizând Big Data Service și OCI. De asemenea, veți adăuga Oracle Cloud SQL la cluster și veți accesa nodul de utilitate și nodul principal, învățând cum să utilizați Cloudera Manager și Hue pentru a accesa clusterul direct dintr-un browser web.

    Începeți să utilizați laboratorul data lake
  • Învățați analiza și machine learning cu Red Bull Racing

    Utilizați analiza și procesul machine learning pentru a analiza 70 de ani de date despre curse. Aflați ce face ca unele curse să fie atât de interesante încât nu vă puteți întoarce privirea, în timp ce altele sunt mult mai previzibile.

    Începeți să utilizați laboratorul de analiză a datelor
  • Începeți să lucrați cu Oracle Cloud Infrastructure Anomaly Detection

    Descoperiți cum să utilizați OCI Anomaly Detection pentru a crea modele personalizate de machine learning. Veți lua datele încărcate de utilizatori, veți utiliza un algoritm specializat pentru a antrena un model și veți implementa modelul în mediul cloud pentru a detecta anomaliile.

    Începeți să utilizați laboratorul de detectare a anomaliilor acum

Contactați departamentul de vânzări

Doriți să aflați mai multe despre un data lake? Unul dintre experții noștri vă va ajuta.

  • Aceștia pot răspunde la întrebări precum

    • Cum pot începe să folosesc un data lake pe Oracle?
    • Ce pot face cu un data lake și nu pot face cu un depozit de date?
    • În ce mod are de câștigat afacerea mea de pe urma utilizării unui data lake?