No se han encontrado resultados

Su búsqueda no coincide con ningún resultado.

Le sugerimos que pruebe lo siguiente para poder encontrar lo que está buscando:

  • Verifique la ortografía de su búsqueda de palabras clave.
  • Utilice sinónimos para la palabra clave que escribió; por ejemplo, intente con “aplicación” en lugar de “software”.
  • Pruebe con una de las búsquedas populares que se muestran a continuación.
  • Comience una nueva búsqueda.
Tendencias de preguntas

¿Qué es un almacén de datos?

Un almacén de datos es un tipo de sistema de gestión de datos que está diseñado para habilitar y admitir actividades de inteligencia empresarial (BI), especialmente análisis. Los almacenes de datos están destinados únicamente a realizar consultas y análisis y, a menudo, contienen grandes cantidades de datos históricos. Los datos dentro de un almacén de datos generalmente se derivan de una amplia gama de fuentes, como archivos de registro de aplicaciones y aplicaciones de transacciones.

Un almacén de datos centraliza y consolida grandes cantidades de datos de distintas fuentes. Sus capacidades analíticas permiten a las organizaciones obtener valiosos conocimientos empresariales de sus datos para mejorar la toma de decisiones. Con el tiempo, crea un registro histórico que puede ser invaluable para los científicos de datos y analistas de negocios. Debido a estas capacidades, un almacén de datos puede considerarse la “única fuente de la verdad” de una organización.

Un almacén de datos típico a menudo incluye los siguientes elementos:

  • Una base de datos relacional para almacenar y administrar datos
  • Una solución de extracción, carga y transformación (ELT) para preparar los datos para el análisis
  • Análisis estadístico, informes y capacidades de minería de datos
  • Herramientas de análisis de clientes para visualizar y presentar datos a usuarios comerciales
  • Otras aplicaciones analíticas más sofisticadas que generan
  • información procesable al aplicar algoritmos de aprendizaje autónomo e inteligencia artificial (IA)

¿Por qué no ejecutar análisis en su entorno OLTP?

Los almacenes de datos son entornos relacionales que se utilizan para el análisis de datos, en particular de datos históricos. Las organizaciones usan almacenes de datos para descubrir patrones y relaciones en sus datos que se desarrollan con el tiempo.

Por el contrario, los entornos transaccionales se utilizan para procesar transacciones de forma continuas y muchas veces se usan para la entrada de pedidos y transacciones financieras y minoristas. No se basan en datos históricos; de hecho, en entornos OLTP, los datos históricos a menudo se archivan o simplemente se eliminan para mejorar el rendimiento.

Los almacenes de datos y los sistemas OLTP difieren de forma significativa.

Almacén de datos Sistema OLTP
Carga de trabajo Acomoda consultas y análisis de datos ad hoc Solo admite operaciones predefinidas
Modificaciones de datos Actualizaciones automáticas de forma regular Actualizaciones de usuarios finales que emiten declaraciones individuales
Diseño de esquema Utiliza esquemas parcialmente desnormalizados para optimizar el rendimiento Utiliza esquemas completamente normalizados para garantizar la coherencia de los datos
Escaneo de datos Abarca de miles a millones de filas Accede solo a un puñado de registros a la vez
Datos históricos Almacena datos de muchos meses o años Almacena datos solo por semanas o meses

Almacenes de datos, data marts y almacenes operacionales de datos

Aunque desempeñan funciones similares, los almacenes de datos son diferentes de los data marts y a los almacenes operacionales de datos (ODS). Un data mart realiza las mismas funciones que un almacén de datos pero dentro de un alcance mucho más limitado, generalmente un solo departamento o línea de negocio. Esto hace que los data marts sean más fáciles de establecer que los almacenes de datos. Sin embargo, tienden a presentar inconsistencias porque puede ser difícil administrar y controlar de manera uniforme los datos en numerosos data marts.

Los ODS solo admiten operaciones diarias, por lo que su visión de los datos históricos es muy limitada. Aunque funcionan muy bien como fuentes de datos actuales y los almacenes de datos suelen utilizarlos como tales, no admiten consultas ricas a nivel histórico.

¿Necesito un lago de datos?

Las organizaciones usan lagos de datos y almacenes de datos para grandes volúmenes de datos de varias fuentes. La elección de cuándo usar uno u otro depende de lo que la organización pretenda hacer con los datos. A continuación se describe cómo se utiliza mejor cada uno:

  • Los lagos de datos almacenan una gran cantidad de datos diferentes y sin filtrar para usarlos más tarde para un propósito en particular. Los datos de aplicaciones de línea de negocio, aplicaciones móviles, redes sociales, dispositivos IoT y más se capturan como datos sin procesar en un lago de datos. La estructura, integridad, selección y formato de los diversos conjuntos de datos se deriva en el momento del análisis por parte de la persona que lo realiza. Cuando las organizaciones necesitan almacenamiento de bajo costo para datos no estructurados ni formateados de varias fuentes que pretenden utilizar para algún propósito en el futuro, un lago de datos podría ser la opción correcta.
  • Los almacenes de datos están específicamente destinados a analizar datos. El procesamiento analítico dentro de un almacén de datos se realiza sobre datos que se prepararon para el análisis, reunidos, contextualizados y transformados, con el propósito de generar ideas basadas en el análisis. Los almacenes de datos también son expertos en el manejo de grandes cantidades de datos de varias fuentes. Cuando las organizaciones necesitan análisis de datos avanzados o análisis que se basan en datos históricos de múltiples fuentes en toda su empresa, un almacén de datos es probablemente la opción correcta.

Beneficios de un almacén de datos

Los almacenes de datos ofrecen el beneficio global y único de permitir a las organizaciones analizar grandes cantidades de datos variantes y extraer un valor significativo de ellos, así como mantener un registro histórico.

Cuatro características únicas (descritas por el informático William Inmon, a quien se considera el padre del almacén de datos) permiten que los almacenes de datos brinden este beneficio global. Según esta definición, los almacenes de datos son

  • orientados a temas. Pueden analizar datos sobre un tema en particular o un área funcional (como ventas).
  • Integrados. Los almacenes de datos crean consistencia entre los diferentes tipos de datos de fuentes diferentes.
  • No volátiles. Una vez que los datos están en un almacén de datos, son estables y no cambian.
  • Variantes en el tiempo. El análisis del almacén de datos analiza los cambios a lo largo del tiempo.

Un almacén de datos bien diseñado realizará consultas muy rápidamente, ofrecerá un alto rendimiento de datos y proporcionará suficiente flexibilidad para que los usuarios finales puedan “analizar minuciosamente” o reducir el volumen de datos para un examen más detallado para satisfacer distintas demandas—ya sea en un nivel alto o en un nivel muy fino y detallado. El almacén de datos sirve como base funcional para entornos de BI de middleware que proporcionan informes, paneles y otras interfaces a los usuarios finales.

Arquitectura del almacén de datos

La arquitectura de un almacén de datos está determinada por las necesidades específicas de la organización. Las arquitecturas comunes incluyen

  • Simpleza. Todos los almacenes de datos comparten un diseño básico en el que los metadatos, los datos de resumen y los datos sin procesar se almacenan en el repositorio central del almacén. El repositorio se alimenta de fuentes de datos en un extremo y los usuarios finales acceden a él para realizar análisis, informes y extracciones en el otro extremo.
  • Simpleza con un área de preparación. Los datos operativos deben limpiarse y procesarse antes de almacenarse. Aunque esto puede realizarse mediante la programación, muchos almacenes de datos agregan un área de preparación de datos antes de que ingresen al almacén, para simplificar la preparación de datos.
  • Sistema de distribución radial. Agregar data marts entre el repositorio central y los usuarios finales le permite a una organización personalizar su almacén de datos para servir a varias líneas de negocios. Cuando los datos están listos para usarse, se mueven al data mart apropiado.
  • Entornos de prueba. Los entornos de prueba son áreas privadas, sólidas y seguras que permiten a las empresas explorar de manera rápida e informal conjuntos de datos nuevos o formas de analizar datos sin tener que respetar o cumplir con las reglas formales y el protocolo del almacén de datos.

La evolución de los almacenes de datos, del análisis de datos a la inteligencia artificial y el aprendizaje autónomo

Cuando los almacenes de datos aparecieron por primera vez a fines de la década de 1980, su propósito era ayudar al flujo de datos de los sistemas operativos a los sistemas de soporte a decisiones (DSS). Estos primeros almacenes de datos requerían una enorme cantidad de redundancia. La mayoría de las organizaciones tenían múltiples entornos de DSS que servían a los diversos usuarios. Aunque los entornos de DSS usaban gran parte de los mismos datos, la recopilación, limpieza e integración de los datos a menudo se replicaba para cada entorno.

A medida que los almacenes de datos se volvieron más eficientes, evolucionaron de depósitos de información que admitían plataformas de Inteligencia Empresarial tradicionales a infraestructuras de análisis amplias que admiten una gran variedad de aplicaciones, tales como análisis operativos y gestión del rendimiento.

Las iteraciones del almacén de datos han progresado con el tiempo para ofrecer un valor adicional gradual a la empresa.

Paso Capacidad Valor empresarial
1 Informes transaccionales Proporciona información relacional para crear snapshots del rendimiento empresarial.
2 Análisis minucioso, consulta ad hoc, herramientas de inteligencia empresarial (BI) Amplía las capacidades para obtener información más detallada y un análisis más sólido
3 Predice el rendimiento futuro (extracción de datos) Desarrolla visualizaciones e inteligencia empresarial con visión a futuro
4 Análisis táctico (espacial, estadístico) Ofrece situaciones “posibles” para informar decisiones prácticas basadas en un análisis más completo
5 Almacena datos de muchos meses o años Almacena datos solo por semanas o meses

Admitir cada uno de estos cinco pasos ha requerido una variedad cada vez mayor de conjuntos de datos. Los últimos tres pasos en particular crean el imperativo de una gama aún más amplia de datos y capacidades analíticas.

Hoy, la inteligencia artificial y el aprendizaje automático están transformando casi todos los activos de la industria, los servicios y las empresas—y los almacenes de datos no son la excepción. La expansión de big data y la aplicación de nuevas tecnologías digitales están impulsando el cambio en los requisitos y capacidades del almacén de datos.

El almacén de datos autónomo es el último paso en esta evolución. Ofrece a las empresas la capacidad de extraer un valor aún mayor de sus datos al tiempo que reduce los costos y mejora la confiabilidad y el rendimiento del almacén de datos.

Obtenga más información sobre los almacenes de datos autónomos y comience con su propio almacén de datos autónomo.

Diseño de un almacén de datos

Cuando una organización se propone diseñar un almacén de datos, debe comenzar por definir sus requisitos comerciales específicos, acordar el alcance y redactar un diseño conceptual. La organización puede crear el diseño lógico y físico para el almacén de datos. El diseño lógico implica las relaciones entre los objetos, mientras que el diseño físico implica la mejor manera de almacenar y recuperar los objetos. El diseño físico también incorpora procesos de transporte, respaldo y recuperación.

Cualquier diseño de almacén de datos debe abordar lo siguiente:

  • Contenido de datos específicos
  • Relaciones dentro de grupos de datos y entre ellos
  • El entorno de sistemas que admitirá el almacén de datos
  • Los tipos de transformaciones de datos que se requieren
  • Frecuencia de la actualización de datos

Uno de los factores principales en el diseño son las necesidades de los usuarios finales. La mayoría de los usuarios finales están interesados en realizar análisis y ver datos en conjunto, en lugar de transacciones individuales. Sin embargo, a menudo los usuarios finales no saben realmente lo que quieren hasta que surge una necesidad específica. Por lo tanto, el proceso de planificación debe incluir suficiente investigación para anticipar las necesidades. Finalmente, el diseño del almacén de datos debe permitir la expansión y la evolución para mantener el ritmo de las necesidades cambiantes de los usuarios finales.

La nube y el almacén de datos

Los almacenes de datos en la nube ofrecen las mismas características y beneficios que los almacenes de datos locales pero con los beneficios adicionales de la computación en la nube―como flexibilidad, escalabilidad, agilidad, seguridad y costos reducidos. Los almacenes de datos en la nube permiten a las empresas centrarse únicamente en extraer valor de sus datos en lugar de tener que construir y administrar la infraestructura de hardware y software para admitir el almacén de datos.

Lea sobre Oracle Cloud y los almacenes de datos (PDF)

Implementación de complejidad cero: Autonomous Data Warehouse

La iteración más reciente del almacén de datos es el almacén de datos autónomo, que se basa en la inteligencia artificial y el aprendizaje automático para eliminar las tareas manuales y simplificar la configuración, la implementación y la gestión de datos. Un almacén de datos autónomo como servicio en la nube no requiere la configuración o gestión de hardware, instalación de software o la administración de bases de datos realizada por humanos.

La creación del almacén de datos, la copia de seguridad, la revisión y actualización de la base de datos y la expansión o reducción de la base de datos se realizan de forma automática—con la misma flexibilidad, escalabilidad, agilidad y costos reducidos que ofrecen las plataformas en la nube. El almacén de datos autónomo elimina la complejidad, acelera la implementación y libera recursos para que las organizaciones puedan concentrarse en actividades que agregan valor al negocio.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse es un almacén de datos totalmente autónomo y fácil de usar que escala de forma elástica, ofrece un rendimiento de consulta rápido y no requiere administración de la base de datos. La configuración de Oracle Autonomous Data Warehouse es muy simple y rápida.

Obtenga más información sobre Oracle Autonomous Database (PDF)