Un data lakehouse es una arquitectura moderna y abierta que te permite almacenar, comprender y analizar todos tus datos. Combina la potencia y la abundancia de los almacenes de datos con la amplitud y flexibilidad de las tecnologías de datos de código abierto más conocidas que utilizas en la actualidad. Un data lakehouse se puede crear desde cero en Oracle Cloud Infrastructure (OCI) para que funcione con los marcos de IA más recientes y servicios de IA predefinidos como el servicio de idioma de Oracle.
Crea, analiza y encuentra con facilidad nuevos conocimientos a partir de todos tus datos, como facturas, formularios, textos, audios y videos.
Descubre cómo un Data Lakehouse en OCI proporciona una plataforma eficiente, integrada y automatizada que integra todos tus datos, ya sea en un almacén de datos, un lago de datos o una salida de aplicación, y agrega capacidades de análisis y aprendizaje automático para ayudarte a aprovechar al máximo tus datos.
Obtén más información sobre patrones, mejores prácticas y arquitecturas para desplegar un data lakehouse en Oracle Cloud Infrastructure.
Los clientes más exitosos se relacionan con especialistas en la nube desde el primer momento. Nuestros ingenieros de nube proporcionan orientación sobre la planificación, el diseño, la creación de prototipos y la gestión de migraciones a la nube, para que puedas avanzar más rápido y con más confianza.
Oracle facilita la transformación de tu equipo de organización y análisis en un equipo de soluciones de data lakehouse utilizando tus competencias y aprovechando las inversiones que ya hayas realizado. Amplía fácilmente tu data lakehouse y los lagos de datos a un data lakehouse, mueve y moderniza los lagos de datos que hayas creado localmente, o empieza por tus datos de Oracle SaaS.
Nuestros clientes pueden migrar fácilmente los lagos de datos existentes o crear otros nuevos de código abierto con nuestros servicios totalmente gestionados, como Oracle Big Data Service y Oracle Data Flow. Spark, VIHE, Hbase y muchos más servicios se pueden desplegar y escalar fácilmente en OCI.
Data Flow es un servicio de Spark sin servidor que permite a nuestros clientes centrarse en sus cargas de trabajo de Spark sin conceptos de infraestructura.
Oracle Autonomous Data Warehouse permite la realización consultas rápidas y escalables directamente a través de cualquier dato del almacén de objetos. Una única consulta puede combinar datos en Autonomous Data Warehouse y en un lago de datos.
Para nuestros clientes actuales del almacén de datos, este es el camino más rápido y sencillo para transformar su almacén en un data lakehouse, lo que te permite almacenar y analizar todos los datos al tiempo que utilizas las aplicaciones, herramientas y habilidades de las que ya dispones.
Los clientes de Oracle desean crear análisis avanzados basados en el aprendizaje automático con sus datos de Oracle SaaS o cualquier dato SaaS. Nuestros conectores de integración de datos de fácil uso para Oracle SaaS, permiten la sencilla creación de un data lakehouse para analizar todos los datos con los datos de SaaS y aceleran la obtención de soluciones.
Todos nuestros servicios de data lakehouse están basados en almacenes de objetos OCI a gran escala y de bajo costo, utilizan OCI Data Catalog para definir datos de forma unificada, se integran fácilmente con una excelente IA y utilizan Oracle Data Integration para la ingesta de datos escalables y su movimiento dentro del data lakehouse.
Oracle Big Data Service es un data lake basado en Hadoop para almacenar y analizar grandes cantidades de datos de clientes sin procesar. Un servicio gestionado, Oracle Big Data Service incluye una pila completamente integrada que incluye herramientas de código abierto y aquellas de valor agregado de Oracle que simplifican tus operaciones de TI. Oracle Big Data Service facilita a las empresas la gestión, estructuración y extracción del valor de los datos de toda la organización.
Oracle Cloud Infrastructure Data Flow es un servicio Apache Spark completamente gestionado sin infraestructura para que los equipos de TI del cliente puedan implementarlo o gestionarlo. Data Flow permite a los desarrolladores entregar aplicaciones más rápidamente, ya que pueden centrarse en el desarrollo de aplicaciones sin distraerse con las operaciones.
Autonomous Data Warehouse es un servicio de data warehouse en la nube que elimina todas las complejidades que conlleva la gestión de un almacén de datos, la protección de los datos y el desarrollo de aplicaciones basadas en datos. Oracle utiliza el aprendizaje automático para automatizar completamente todas las tareas rutinarias de almacenaje de datos, lo que garantiza mayor rendimiento, fiabilidad, seguridad y eficiencia operativa.
MySQL HeatWave es el único servicio que permite a los administradores de bases de datos y desarrolladores de aplicaciones ejecutar cargas de trabajo OLTP y OLAP directamente desde su base de datos MySQL. Esto elimina la necesidad de movimientos e integración de datos complejos, laboriosos y costosos con una base de datos de análisis independiente.
Oracle Cloud Infrastructure Data Catalog ayuda a los profesionales de datos de toda la organización a buscar, explorar y controlar los datos mediante un inventario de activos de datos de toda la empresa. Recopila automáticamente metadatos en los almacenes de datos de una organización y proporciona un almacén de metadatos común para data lakes. Data Catalog simplifica la definición de glosarios empresariales e información seleccionada sobre los activos de datos ubicados en Oracle Cloud Infrastructure y otras ubicaciones. De este modo, los consumidores de datos pueden encontrar fácilmente los datos que necesitan.
Simplifique sus procesos complejos de extracción, transformación y carga (ETL/E-LT) de datos en data lakes y almacenes para tareas de ciencia de datos y analítica con el diseñador moderno de flujo de datos sin código de Oracle.
Migración de datos avanzada para extraer, transformar y cargar. Oracle Data Integrator está optimizado para las bases de datos de Oracle, como Oracle Autonomous Database y Oracle Database Exadata Cloud Service, así como para las bases de datos on-premises. Incluye la mejor compatibilidad de su clase con orígenes y destinos heterogéneos.
Oracle GoldenGate ofrece alta disponibilidad, integración de datos en tiempo real, captura de datos modificados, replicación de datos, transformaciones y verificación entre sistemas empresariales operativos y analíticos.
El servicio Streaming es una plataforma de transmisión de eventos en tiempo real, sin servidor y compatible con Apache Kafka para desarrolladores y científicos de datos. Streaming está estrechamente integrado con Oracle Cloud Infrastructure, Oracle Database, Oracle GoldenGate y Oracle Integration and Migration. El servicio también proporciona integraciones listas para usar para cientos de productos de terceros en categorías como DevOps, bases de datos, big data y aplicaciones SaaS.
Object Storage permite a los clientes almacenar cualquier tipo de datos en su formato nativo. Es ideal para crear aplicaciones modernas que requieren escala y flexibilidad, ya que se puede usar para consolidar múltiples fuentes de datos con fines de analítica, copias de seguridad o archivados.
Experian mejoró el rendimiento en un 40 % y redujo los costos en un 60 % cuando trasladó cargas de trabajo de datos esenciales de otras nubes a un data lakehouse en OCI, acelerando el procesamiento de datos e innovación de productos al tiempo que amplía las oportunidades de acceso a crédito en todo el mundo.
Ingersoll Rand consolidó múltiples ERP, almacenes de datos y sistemas de big data locales en un data lakehouse en Oracle Cloud Infrastructure, lo que le dio a la empresa una única fuente de información para todos los datos con mayores niveles de fiabilidad y rendimiento.
Las soluciones de partners de Oracle aprovechan y aumentan los almacenes de lago de datos en OCI.
Puedes crear clústers de big data con opciones para diversas unidades de nodo y tamaños de almacenamiento. En este taller, crearás un clúster sin HA y asignarás unidades pequeñas a los nodos. Este clúster es perfecto para probar aplicaciones.
Descubre cómo los desarrolladores y científicos de datos de Spark pueden crear, editar y ejecutar trabajos de Spark a cualquier escala sin la necesidad de clústers, un equipo de operaciones o conocimientos especializados en Spark.
Descubre cómo crear usuarios, accesos y políticas para desarrollar un nuevo catálogo y, a continuación, recopila datos de almacenamiento de objetos, bases de datos y orígenes de datos locales.
Descubre cómo configurar la integración de datos, conectarte a fuentes de datos, ingerir y transformar datos y cargar datos en almacenes de objetos o bases de datos de Oracle.