Un data lakehouse este o arhitectură modernă, deschisă, care vă permite să stocați, să cunoașteți și să analizați toate datele dvs. Acesta combină puterea și bogăția depozitelor de date cu amploarea și flexibilitatea celor mai populare tehnologii de date open source care se utilizează astăzi. Un data lakehouse se poate crea de la zero pe Oracle Cloud Infrastructure (OCI), pentru a lucra cu cele mai noi frameworkuri AI și servicii AI prestabilite, cum ar fi serviciul lingvistic Oracle.
Unificați, analizați și găsiți ușor informații noi din toate datele dvs., cum ar fi facturi, formulare, text sau fișiere audio și video.
Aflați că un data lakehouse pe OCI oferă o platformă eficientă, integrată și automatizată, ce integrează toate datele dvs. - într-un depozit de date, un data lake sau o aplicație - și adaugă funcționalități de analiză și machine learning pentru a ajuta să vă valorificați datele la maximum.
Aflați care sunt tiparele, cele mai bune practici și arhitecturile pentru implementarea unui sistem lakehouse pe Oracle Cloud Infrastructure.
Cei mai de succes clienți contacteză specialiști în cloud chiar de la început. Inginerii noștri pentru cloud oferă îndrumări cu privire la planificare, arhivare, prototipare și gestionarea migrărilor în cloud, astfel încât să efectuați tranziția mai rapid și cu mai multă încredere.
Cu ajutorul Oracle, va fi ușor să vă transformați organizația și echipa de analiză într-o echipă de soluții lakehouse, utilizând capacitățile și profitând de investițiile pe care le-ați făcut deja. Vă extindeți cu ușurință depozitul de date și sistemele data lake într-un data lakehouse unic, mutați și modernizați sistemele data lake pe care le-ați creat on-premises sau începeți de la datele SaaS Oracle.
Clienții noștri pot să migreze cu ușurință sistemele data lake open sourse existente sau să creeze unele noi cu ajutorul serviciilor noastre complet gestionate precum Oracle Big Data Service și Oracle Data Flow. Spark, HIVE, Hbase și multe alte servicii pot fi implementate și scalate cu ușurință pe OCI.
Data Flow este un serviciu Spark fără server, care le permite clienților noștri să se concentreze asupra fluxurilor lor de lucru Spark fără niciun fel de concepte de infrastructură.
Oracle Autonomous Data Warehouse permite interogări rapide și scalabile direct, pentru orice date din spațiul de stocare. O singură interogare poate reuni datele în Autonomous Data Warehouse și într-un data lake.
Pentru clienții noștri cu depozit de date actuali, aceasta este cea mai rapidă și mai simplă cale de a transforma depozitul de date într-un data lakehouse, care permite stocarea și analizarea tuturor datelor, fiind utilizate, însă, și aplicațiile, instrumentele și capacitățile deja existente.
Clienții Oracle doresc să creeze analize avansate, bazate pe machine learning, cu datele lor din SaaS Oracle sau din orice SaaS. Datorită conectorilor noștri de integrare a datelor pentru SaaS Oracle, care sunt ușor de utilizat, crearea unui lakehouse pentru analizarea tuturor datelor din SaaS este simplă și reduce durata soluționării.
Toate serviciile noastre pentru data lakehouse sunt create pe OCI Object Stores, un sistem foarte scalabil și cu costuri reduse, utilizeazăOCI Data Catalog, pentru definirea unificată a datelor, se integrează ușor cu AI puternică și utilizează Oracle Data Integration pentru ingestia și mutarea scalabilă a datelor în cadrul sistemului lakehouse.
Oracle Big Data Service este un lac de date bazat pe Hadoop, pentru stocarea și analizarea unor cantități mari de date brute despre clienți. Fiind un serviciu gestionat, Oracle Big Data Service vine cu o stivă complet integrată care include atât instrumente open source, cât și instrumente Oracle cu valoare adăugată, simplificându-vă operațiunile IT. Oracle Big Data Service le facilitează companiilor gestionarea, structurarea și extragerea valorii din datele existente în întreaga organizație.
Oracle Cloud Infrastructure Data Flow este un serviciu Apache Spark complet gestionat, fără infrastructură, destinat implementării sau gestionării de către departamentele IT ale clienților. Data Flow permite dezvoltatorilor să livreze aplicațiile mai rapid, deoarece se pot concentra pe dezvoltarea aplicațiilor, fără ca operațiunile să le distragă atenția.
Autonomous Data Warehouse este un serviciu pentru depozitarea datelor în cloud care elimină complexitatea utilizării unui depozit de date sau centru de date, securizării datelor și dezvoltării unor aplicații bazate pe date. Oracle utilizează machine learning pentru a automatiza complet toate activitățile de rutină legate de sistemul warehouse - asigurând creșterea performanței, fiabilității, securității și eficienței operaționale.
MySQL HeatWave este singurul serviciu care le permite administratorilor de baze de date și dezvoltatorilor de aplicații să ruleze fluxurile de lucru OLTP și OLAP direct din baza de date MySQL. Acest lucru elimină necesitatea unui transfer și a unei integrări complexe a datelor cu o bază de date cu analize separată, care necesită mult timp și este costisitoare.
Oracle Cloud Infrastructure Data Catalog îi ajută pe profesioniștii de date din întreaga organizație să caute, să exploreze și să guverneze date folosind o gamă largă de active de date la nivel de întreprindere. Aceasta recoltează automat metadatele din depozitele de date ale unei organizații și oferă un metadepozit comun pentru lacurile de date. Catalogul de date simplifică definiția glosarelor de afaceri și a informațiilor selectate despre activele de date situate în Oracle Cloud Infrastructure și alte locații, astfel încât consumatorii de date să poată găsi cu ușurință datele necesare.
Simplificați-vă procesele complexe de extragere, transformare și încărcare a datelor (ETL/E-LT) în structuri data lake și depozite pentru știința și analiza datelor cu ajutorul programului modern, no-code, destinat proiectării fluxurilor de date, de la Oracle.
Migrare avansată a datelor, pentru extragere, transformare și încărcare Oracle Data Integrator este optimizat pentru bazele de date Oracle, cum ar fi Oracle Autonomous Database și Oracle Database Exadata Cloud Service, cât și pentru bazele de date on-premise. Include cea mai acceptare din clasă pentru surse și ținte eterogene.
Oracle GoldenGate permite integrarea datelor în timp real, cu disponibilitate ridicată, captarea datelor de schimbare, replicarea datelor, transformări și verificarea între sistemele enterprise de tip operațional și analitic.
Serviciul Streaming este o platformă de streaming de evenimente în timp real compatibilă cu Apache Kafka, dedicată dezvoltatorilor și experților în știința datelor. Streaming este strâns integrat cu Oracle Cloud Infrastructure, Oracle Database, Oracle GoldenGate și Oracle Integration and Migration. De asemenea, serviciul oferă integrări predefinite pentru sute de produse terțe din categorii precum aplicațiile pentru dezvoltatori, baze de date, big data și SaaS.
Object Storage permite clienților să stocheze orice tip de date în formatul lor nativ. Soluția este ideală pentru crearea aplicațiilor moderne care necesită scalabilitate și flexibilitate, deoarece poate fi utilizată pentru centralizarea mai multor surse de date pentru analize, backup sau arhivare.
Experian a îmbunătăţit performanța cu 40% și a redus costurile cu 60% atunci când a trecut fluxurile de lucru esențiale din alte clouduri într-un data lakehouse pe OCI, accelerând procesele de prelucrare a datelor și inovare a produselor și extinzându-și totodată oportunitățile de creditare în întreaga lume.
Ingersoll Rand a consolidat mai multe sisteme ERP, depozite de date și sisteme Big Data on-premises într-un singur data lakehouse pe Oracle Cloud Infrastructure, beneficiind astfel de o singură sursă pentru toate datele, mai de încredere și cu performanțe mai bune.
Soluțiile pentru partenerii Oracle utilizează și extind sistemele data lakehouse din OCI.
Puteți crea clustere Big Data cu opțiuni pentru configurarea nodurilor și dimensiunea spațiului de stocare. În acest atelier, creați un cluster non-HA și asignați nodurilor dimensiuni mici. Acest cluster este perfect pentru testarea aplicațiilor.
Aflați cum creează, editează și rulează dezvoltatorii și experții în date Spark joburi Spark la orice scară fără a fi nevoie de clustere, de o echipă de operațiuni sau de foarte multe cunoștințe despre Spark.
Aflați cum să creați utilizatori, acces și politici pentru a realiza un catalog nou și a colecta date din spațiul de stocare, din bazele de date și din sursele de date on-premises.
Aflați cum să configurați Data Integration, să vă conectați la surse de date, să introduceți și să transformați date și să încărcați date în spațiul de stocare și/sau în baze de date Oracle.