Data Lake

Um data lake é um repositório de dados estruturados, semiestruturados e não estruturados em qualquer formato e tamanho e em qualquer escala que possam ser analisados facilmente. Com a Oracle Cloud Infrastructure (OCI), você pode criar um data lake seguro, econômico e fácil de gerenciar. Um data lake na OCI é totalmente integrado aos seus data warehouses e análises preferidos, bem como a outros serviços OCI, como catálogo de dados, segurança e serviços de observabilidade.

O que é um data lake? (0:44)
Qualquer dado, qualquer fonte

Migre os seus dados em lotes ou fluxos perfeitamente para um data lake OCI onde eles podem ser analisados. Aproveite a OCI Data Integration, OCI GoldenGate ou OCI Streaming para ingerir seu dados e armazená-los em OCI Object Storage.

Diga adeus aos silos de dados!

Um data lake central na OCI integra-se com suas ferramentas preferidas, incluindo bancos de dados como Oracle Autonomous Data Warehouse, MySQL HeatWave, análises e ferramentas de machine learning (ML), como Oracle Analytics Cloud, e projetos de código aberto, como Apache Spark.

Aproveite IA e ML

Um conjunto abrangente de serviços de IA e ML permite que você obtenha novos insights de seus dados, faça previsões, reduza sua sobrecarga operacional e melhore a experiência do cliente.

Descubra e proteja seus dados

Catalogue seus dados e obtenha insights sobre seu data lake com o OCI Data Catalog. Habilite ferramentas de consulta e bancos de dados para descobrir e consultar seus dados no armazenamento de objetos.

Obtenha acesso antecipado ao OCI Data Lake

A Oracle Cloud Infrastructure está lançando um serviço de data lake totalmente gerenciado chamado OCI Data Lake esse ano. Você pode se inscrever para ter acesso antecipado e explorar os recursos e as capacidades antes dele ser lançado para o público geral.

Por que usar um data lake na OCI?


Modernize seu data lake

Um data lake possibilita trabalhar com mais tipos de dados, mas o tempo e o esforço necessários para gerenciá-los podem ser desvantajosos. Ao oferecer serviços de data lake de código aberto totalmente gerenciados, a OCI oferece custos mais baixos e menos gerenciamento, portanto, você pode esperar custos operacionais reduzidos, escalabilidade e segurança aprimoradas e a capacidade de incorporar todos os seus dados atuais em um só lugar.


Amplie o seu data warehouse

Data warehouses e data marts são essenciais para o sucesso do negócio. Integrá-los com um data lake aumentará ainda mais seu valor. A integração entre bancos de dados, data warehouses e um data lake com Oracle significa que os dados podem ser acessados de vários locais com uma única consulta SQL. As aplicações e ferramentas atuais obtêm acesso transparente a todos os dados, sem alterações e sem necessidade de aprender novas habilidades.


Use análise avançada nas aplicações da Oracle

Os dados gerados por aplicativos empresariais são altamente valiosos, mas raramente são totalmente utilizados. Um data lake na OCI simplifica o acesso aos dados de vários aplicativos e permite análises sofisticadas que podem significar a diferença entre um bom trimestre ou um trimestre ruim.

Solução de data lake integrada à OCI

Centralize seus dados com uma experiência integrada de integração de dados OCI.

Consulte quaisquer dados de qualquer fonte sem replicação.

Aplicações pré-integradas para retorno instantâneo.

Catalogue e controle com uma experiência integrada do OCI Data Catalog.

Proteja os dados com políticas de controle de acesso refinadas e baseadas em função.

A plataforma de dados Oracle libera todo o potencial de seus dados

  • Combine dados transacionais e analíticos para evitar silos.
  • Aproveite o Oracle IaaS para o Oracle SaaS, ou qualquer coisa intermediária - selecione a quantidade de controle desejada.
  • Traga qualquer tipo de dados para a plataforma - quebramos a barreira entre dados estruturados e não estruturados.
  • Explore o poder da OCI e sua abertura para outros provedores de serviços em nuvem - nós o encontraremos onde você estiver.
  • Use os principais relatórios do Oracle Analytics Cloud ou qualquer aplicação de análise de terceiros — a OCI é aberta.
Diagrama de visão geral da plataforma de dados Oracle, descrição abaixo O diagrama mostra a plataforma de dados Oracle com fontes de dados, serviços de movimentação de dados, como serviços de integração, o núcleo da moderna plataforma de dados Oracle e possíveis resultados e desenvolvimento de aplicativos serviços.

Integre o Autonomous Database a data lakes

O Oracle Autonomous Database oferece suporte à integração com data lakes, não apenas na Oracle Cloud Infrastructure, mas também no Amazon Web Services (AWS), Microsoft Azure, Google Cloud e muito mais. Você tem a opção de carregar dados no banco de dados ou consultar os dados diretamente no armazenamento de objeto de origem. Ambas as abordagens usam as mesmas ferramentas e APIs para acessar os dados.

Essa arquitetura às vezes é chamada de arquitetura de lakehouse.



Diagrama do Autonomous Database com data lakes, descrição abaixo O diagrama mostra uma arquitetura de uma plataforma de dados que utiliza o Oracle Autonomous Database, com fontes de dados, Oracle Autonomous Database e resultados.

Análise em tempo real de todos os seus dados com MySQL HeatWave Lakehouse

Um serviço de banco de dados em nuvem MySQL para transações, análises em tempo real em data warehouses e data lakes e machine learning sem a complexidade, a latência, os riscos e os custos da duplicação de ETL.



Diagrama do Autonomous Database com data lakes, descrição abaixo O diagrama mostra uma arquitetura de uma plataforma de dados aproveitando o Oracle MySQL HeatWave, com fontes de dados, MySQL Heatwave e resultados.

Crie um data lake com serviços de código aberto gerenciados pela Oracle

Crie rapidamente data lakes baseados em Hadoop ou Spark para estender seus data warehouses e garantir que todos os dados sejam facilmente acessíveis e gerenciados de maneira econômica.



Diagrama do Autonomous Database com data lakes, descrição abaixo O diagrama mostra uma arquitetura de uma plataforma de dados aproveitando os serviços de código aberto gerenciados pela Oracle, como Hadoop, Spark e OpenSearch, com fontes de dados, serviços de código aberto da Oracle no núcleo e possíveis resultados.

Serviços de data lake da Oracle

Migração e integração de dados

Conecte e estenda aplicações de análises com dados transacionais consistentes em tempo real, carregamentos de lote eficientes e dados de streaming.

  • OCI Data Integration
    Simplifique seus processos complexos de extração, transformação e carregamento (ETL/E-LT) em data lakes e armazéns de dados para ciência e análise de dados com um designer de fluxo de dados sem código.
  • Oracle Data Integrator
    O Data Integrator fornece migração avançada de dados para extração, transformação e carregamento. O Oracle Data Integrator é otimizado para bancos de dados em nuvem da Oracle, bem como para bancos de dados on-premises.
  • Oracle GoldenGate
    O Oracle GoldenGate permite alta disponibilidade, integração de dados em tempo real, captura de dados alterados, replicação de dados, transformações e verificação entre sistemas corporativos operacionais e analíticos.
  • OCI Streaming
    O Streaming oferece integrações prontas para uso a centenas de produtos de terceiros em categorias como DevOps, bancos de dados, big data e aplicações SaaS.

Data lake

Crie um data lake usando serviços de dados totalmente gerenciados com custos mais baixos e menos esforço.

  • OCI Data Lake
    O Data Lake oferece armazenamento centralizado e metadados para seus dados estruturados e não estruturados com controle de acesso unificado e detalhado.
  • OCI Object Storage
    O Object Storage permite que os clientes armazenem qualquer tipo de dados em seu formato nativo. Isso é ideal para criar aplicações modernas que exigem escala e flexibilidade.
  • OCI Data Catalog
    O Data Catalog ajuda os profissionais de dados em toda a organização a pesquisarem, explorarem e controlarem os dados usando um inventário de ativos de dados em toda a empresa.
  • OCI Data Flow
    O Data Flow é um serviço Apache Spark totalmente gerenciado para executar tarefas de processamento em conjuntos de dados extremamente grandes sem infraestrutura para ser implementada ou gerenciada. Isso permite a entrega rápida de aplicativos porque os desenvolvedores podem se concentrar no desenvolvimento de aplicativos, não no gerenciamento da infraestrutura.
  • Oracle Big Data
    O Big Data Service é um serviço de data lake baseado em Hadoop para armazenar e analisar grandes quantidades de dados brutos de clientes. O Oracle Big Data Service, por ser um serviço gerenciado, integra todo o conjunto de ferramentas de código livre e as ferramentas da Oracle que em conjunto simplificam as operações de TI.

Data lakehouse

Aproveite a integração entre a OCI e seus data lakes com seus data warehouses preferidos e descubra novos insights.

  • MySQL Heatwave Lakehouse
    O MySQL HeatWave Lakehouse se conecta de forma transparente a data lakes, permitindo que os usuários processem e consultem centenas de terabytes de dados no armazenamento de objetos em vários formatos de arquivo, incluindo Backups CSV, Parquet e Aurora/Redshift.
  • Recursos de lakehouse do Autonomous Database
    O Autonomous Database permite um data lakehouse de autoatendimento, permitindo que os usuários carreguem ou consultem arquivos diretamente em todos os armazenamentos de objetos (incluindo OCI, AWS, Azure, e Google Cloud Platform). A análise integrada de machine learning, espacial, de texto e de gráfico permite insights sem mover dados.

IA e machine learning

Obtenha insights de dados com modelos de IA pré-criados ou crie os seus próprios.

  • OCI AI Services
    O AI Services é uma coleção de serviços com modelos de machine learning pré-construídos que facilitam para os desenvolvedores aplicar IA a aplicativos e operações de negócios. Os modelos podem ser treinados de forma personalizada para obter resultados de negócios mais precisos.
  • OCI Data Science
    Crie, treine, implemente e gerencie rapidamente modelos de machine learning com um serviço de ciência de dados criado para equipes.
  • Machine Learning no Oracle Database
    Machine Learning no Oracle Database oferece suporte a exploração de dados, preparação e modelagem de machine learning em escala.
  • MySQL HeatWave AutoML
    O MySQL HeatWave AutoML inclui tudo o que os usuários precisam para criar, treinar, implementar e explicar os modelos de machine learning no MySQL HeatWave, sem custo adicional.
Serviços financeiros
A Experian acelera a inclusão financeira com um data lakehouse na OCI.
Mineração
A MineSense alcançou consultas 5 vezes mais rápidas com um lakehouse no OCI.
Publicidade
A Beso unificou dados de 23 origens online com uma variedade de origens offline para criar um data lake que se expandirá para 100 origens.
Tecnologia em esporte
Com um data lakehouse da Oracle, os Seattle Sounders gerenciam 100 vezes mais dados, geram insights 10 vezes mais rápido e reduzem o gerenciamento de banco de dados.

Ecossistema de parceiros do Data Lakehouse

As soluções de parceiros da Oracle aproveitam e aumentam os data lakehouses na OCI.

  • Logotipo da Accenture
  • Logotipo da Capgemini
  • Logo da Deloitte
  • Logotipo da h2o.ai
  • Logotipo da qubix
  • Logotipo da Reply Technology
  • Logotipo da Sesame Software
  • Logotipo da wandisco

A Informatica é a parceira preferencial para integração e governança de dados para soluções de data warehouse e lakehouse.

Adoção de data lake na Oracle Cloud Infrastructure

Veja todas as arquiteturas de referência
A série do Oracle Playbook

Compilamos os segredos do nosso pessoal, processo e estratégia de sistemas. E queremos compartilhá-los com você.

Primeiros passos com um data lake na OCI

Experimente os serviços de nuvem de uso livre e faça um teste de 30 dias

A Oracle oferece um Modo Gratuito sem limite de tempo em uma seleção de serviços, incluindo Autonomous Data Warehouse, OCI Compute e produtos Oracle Storage, bem como US$300 em créditos gratuitos para experimentar serviços de nuvem adicionais. Obtenha os detalhes e inscreva-se para uma conta gratuita hoje mesmo.

  • O que está incluído no Oracle Cloud - Modo Gratuito?

    • Uso Livre
    • 2 bancos de dados autônomos com 20 GB cada
    • VMs de Computação
    • 100 GB de volume em bloco
    • 10 GB de armazenamento de objetos

Aprenda com um laboratório prático

A melhor maneira de aprender é tentar você mesmo. Experimente este workshop gratuito sobre data lake, que demonstra um cenário de uso típico e destaca algumas das ferramentas que você pode usar para criar um data lake.

  • Acesse o Data Lake usando o Autonomous Database e o Data Catalog

    Os laboratórios deste workshop orientam você pelas etapas necessárias para acessar um data lake criado com buckets do Oracle Object Storage usando o Oracle Autonomous Database e o OCI Data Catalog.

    Inicie o laboratório de acesso ao data lake
  • Introdução ao Oracle Big Data Service

    Saiba como criar e monitorar um cluster do Hadoop de alta disponibilidade usando o Big Data Service e a OCI. Você também adicionará o Oracle Cloud SQL ao cluster e acessará o utilitário e o nó mestre e aprenderá a usar o Cloudera Manager e o Hue para acessar o cluster diretamente em um navegador web.

    Inicie o laboratório de data lake
  • Aprenda análises e machine learning com a Red Bull Racing

    Use análises e machine learning para analisar 70 anos de dados de corrida. Descubra o que torna algumas corridas tão emocionantes que você não consegue desviar o olhar, enquanto outras são mais previsíveis.

    Participe do laboratório de análise de dados
  • Introdução ao Oracle Cloud Infrastructure Anomaly Detection

    Descubra como usar o OCI Anomaly Detection para criar modelos personalizados de machine learning. Você utilizará dados transferidos por upload pelos usuários, usará um algoritmo especializado para treinar um modelo e o implementará no ambiente de nuvem para detectar anomalias.

    Inicie o laboratório de detecção de anomalias agora

Fale com a equipe de vendas

Interessado em aprender mais sobre data lakes? Deixe um de nossos especialistas ajudar.

  • Eles podem responder a perguntas como:

    • Como começo a usar um data lake na Oracle?
    • O que posso fazer com um data lake que não posso fazer com um data warehouse?
    • Como minha empresa pode se beneficiar de um data lake?