No se han encontrado resultados

Su búsqueda no coincide con ningún resultado.

Le sugerimos que pruebe lo siguiente para encontrar lo que busca:

  • Compruebe la ortografía de la búsqueda por palabras clave.
  • Utilice sinónimos de la palabra clave que escribió; por ejemplo, pruebe con “aplicación” en lugar de “software”.
  • Pruebe una de las búsquedas populares que se muestran a continuación.
  • Realice una nueva búsqueda.
Preguntas más populares

¿Qué es un almacén de datos?

Un almacén de datos es un tipo de sistema de gestión de datos diseñado para habilitar y dar soporte a las tareas de inteligencia empresarial (BI), especialmente las analíticas. Los almacenes de datos solo se han diseñado para realizar consultas y tareas de análisis, y suelen contener grandes cantidades de datos históricos. A menudo, la información dentro de un almacén de datos proviene de una amplia gama de fuentes, como los archivos de registro de aplicaciones o las aplicaciones de transacción.

Un almacén de datos centraliza y fusiona grandes cantidades de datos de múltiples fuentes. Gracias a sus capacidades analíticas, las organizaciones pueden obtener información empresarial valiosa a partir de los datos y mejorar las decisiones. Con el tiempo, se construye un registro histórico de gran valor para los expertos en datos y los analistas de negocio. Debido a estas funciones, se puede considerar al almacén de datos como la “única fuente de información” de una entidad.

Un almacén de datos típico suele incluir los siguientes elementos:

  • Una base de datos relacional para almacenar y gestionar los datos.
  • Una solución de extracción, carga y transformación (ELT) para preparar los datos para el análisis.
  • Análisis estadísticos, informes y funciones de extracción de datos.
  • Herramientas de análisis de clientes para visualizar y presentar datos a usuarios de negocio.
  • Otras aplicaciones analíticas más sofisticadas para generar información
  •  con la que tomar medidas, gracias a la aplicación de algoritmos de aprendizaje automático e inteligencia artificial (IA).

Analítica en entornos OLTP, ¿por qué no?

Los almacenes de datos son entornos relacionales que se utilizan para el análisis de datos, sobre todo para datos históricos. Las organizaciones utilizan los almacenes de datos para descubrir en sus datos patrones y relaciones que se desarrollan con el tiempo.

En contraste, los entornos transaccionales se utilizan para procesar transacciones de forma continua, y se utilizan comúnmente para la entrada de pedidos y las transacciones financieras y de ventas. No se basan en datos históricos; de hecho, en los entornos OLTP los datos históricos se suelen archivar o simplemente se eliminan para mejorar el rendimiento.

Los almacenes de datos y los sistemas OLTP son muy diferentes.

Almacén de datos Sistema OLTP
Carga de trabajo Permite consultas ad-hoc y análisis de datos Solo permite operaciones predefinidas
Modificaciones de datos Actualizaciones automáticas de forma regular Las actualizaciones las realizan los usuarios finales al emitir declaraciones individuales
Diseño de esquemas Utiliza esquemas parcialmente desnormalizados para optimizar el rendimiento Utiliza esquemas completamente normalizados para garantizar la uniformidad de los datos
Escaneo de datos Abarca miles de millones de filas Solo puede acceder a unos pocos registros al mismo tiempo
Datos históricos Almacena meses o años de datos Solo almacena datos de las últimas semanas o meses

Almacenes de datos, data marts y almacenes de datos operativos

Aunque desempeñan funciones similares, los almacenes de datos, los data marts y los almacenes de datos operativos (ODS) tienen diferencias entre sí. Un data mart realiza las mismas funciones que un almacén de datos, pero en un ámbito mucho más limitado; normalmente, para un solo departamento o área de negocio. Es por eso que es más fácil establecer un data mart que un almacén de datos. Sin embargo, suelen introducir incoherencias, ya que es difícil administrar y controlar los datos de manera uniforme en muchos data marts.

Los ODS solo admiten operaciones diarias, por lo que su visión de los datos históricos es muy limitada. Aunque funcionan muy bien como fuentes de datos actuales y los almacenes de datos los emplean de ese modo, no admiten consultas avanzadas de datos históricos.

¿Necesito un data lake?

Cuando las organizaciones tienen que gestionar grandes volúmenes de datos de diversas fuentes, utilizan tanto data lakes como almacenes de datos. La opción de usar un sistema u otro depende de lo que la organización quiera hacer con los datos. A continuación, describimos cómo utilizar uno y otro:

  • Los data lakes almacenan una gran cantidad de datos sin filtrar y de todo tipo, a fin de usarlos más adelante para un fin determinado. En un data lake, los datos de aplicaciones de áreas de negocio, aplicaciones móviles, redes sociales, dispositivos de IoT, etc. se obtienen como datos sin procesar. La estructura, la integridad, la selección y el formato de los diversos conjuntos de datos se adquiere en el momento del análisis por parte de la persona que lo realiza. Cuando las organizaciones necesitan un almacenamiento de bajo coste para datos sin estructura ni formato y de múltiples fuentes (a fin de usarlos en el futuro para algún propósito en particular), los data lakes podrían ser la opción ideal.
  • Los almacenes de datos están diseñados específicamente para analizar datos. El procesamiento analítico dentro de un almacén de datos se realiza sobre datos que se han preparado para el análisis (recopilación, contextualización y transformación) con el fin de generar conocimientos basados en ese análisis. Los almacenes de datos también son perfectos para gestionar grandes cantidades de datos de diversas fuentes. Cuando las organizaciones necesitan una analítica de datos avanzada o un análisis que se base en datos históricos de múltiples fuentes de toda la empresa, es probable que el almacén de datos sea la mejor opción.

Las ventajas de un almacén de datos

Los almacenes de datos ofrecen una ventaja exclusiva y global: permitir a las organizaciones analizar grandes cantidades de datos de variables y extraer un valor significativo, además de mantener un registro histórico.

Los almacenes de datos cuentan con cuatro características exclusivas (descritas por el experto en informática William Inmon, considerado el originador de los almacenes de datos) por las que pueden aportar esta ventaja global. Según esta definición, los almacenes de datos disponen de las siguientes características:

  • Orientados a sujetos. Pueden analizar datos sobre un tema particular o área funcional (como las ventas).
  • Integrados. Los almacenes de datos crean uniformidad entre diferentes tipos de datos de fuentes dispares.
  • No volátiles. Cuando la información entra en un almacén de datos, es estable y no cambia.
  • Tienen en cuenta las variaciones a lo largo del tiempo. La analítica de los almacenes de datos toma en consideración los cambios que se producen con el tiempo.

Un almacén de datos bien diseñado realizará consultas muy rápidamente, ofrecerá una gran producción de datos y aportará la flexibilidad necesaria para que los usuarios finales puedan “cortar y fragmentar” o reducir el volumen de datos para realizar un examen más detallado y cumplir con diferentes demandas, ya sea a un nivel muy global o muy detallado. El almacén de datos es la base funcional para los entornos de BI middleware que suministran informes, cuadros de mando y otras interfaces a los usuarios finales.

Arquitectura de un almacén de datos

La arquitectura de un almacén de datos depende de las necesidades específicas de la organización. Algunas de las arquitecturas más comunes son:

  • Sencilla. Todos los almacenes de datos comparten un diseño básico en el que los metadatos, los datos de resumen y los datos sin procesar se almacenan en el repositorio central del almacén. En uno de los lados, el repositorio se alimenta de fuentes de datos y, en el otro, los usuarios finales acceden para las tareas de análisis, elaboración de informes y extracción.
  • Sencilla con zona de preparación. Es necesario limpiar y procesar los datos operativos antes de colocarlos en el almacén. Aunque esto se puede hacer mediante programación, muchos almacenes de datos añaden una zona de preparación de datos antes de introducirlos en el almacén, a fin de simplificar la preparación.
  • Radial. Al añadir data marts entre el repositorio central y los usuarios finales, las organizaciones pueden personalizar su almacén de datos para atender a varias áreas de negocio. Cuando los datos ya están listos para el uso, se mueven al data mart correspondiente.
  • Entorno de pruebas. Los entornos de pruebas (sandbox) son zonas seguras, privadas y protegidas donde las empresas pueden explorar de forma rápida e informal nuevos conjuntos de datos o nuevas maneras de analizarlos sin tener que cumplir con las reglas y los protocolos formales del almacén de datos.

La evolución de los almacenes de datos: desde la analítica de datos hasta la IA y el aprendizaje automático

Cuando aparecieron por primera vez los almacenes de datos a finales de los 80, su objetivo era que los datos pasaran de los sistemas operativos a los sistemas de apoyo a las decisiones (DSS). Aquellos primeros almacenes de datos necesitaban un volumen enorme de redundancias. La mayoría de empresas tenían múltiples entornos DSS para sus diferentes usuarios. Aunque los entornos DSS utilizaban, en gran medida, los mismos datos, la recopilación, la limpieza y la integración de estos se solía replicar para cada entorno.

A medida que los almacenes de datos se volvieron más eficientes, pasaron de ser almacenes de información compatibles con plataformas de BI tradicionales a convertirse en infraestructuras analíticas más abiertas que admitían una amplia variedad de aplicaciones, como la analítica operativa o la gestión del rendimiento.

Las iteraciones en los almacenes de datos han mejorado con el tiempo y ahora aportan a la empresa un valor adicional progresivo.

Paso Función Valor para la empresa
1 Elaboración de informes sobre transacciones Suministra información relacional para crear instantáneas del rendimiento de la empresa
2 Corte y fragmentación, consultas ad hoc, herramientas de BI Funciones avanzadas para lograr conocimientos más profundos y un análisis más sólido
3 Predicción de rendimiento en el futuro (minería de datos) Desarrolla visualizaciones y una inteligencia empresarial progresiva
4 Análisis táctico (espacial, estadístico) Ofrece escenarios “hipotéticos” para informar sobre decisiones prácticas basadas en un análisis más completo.
5 Almacena meses o años de datos Solo almacena datos de las últimas semanas o meses

El soporte para cada uno de estos cinco pasos requiere de una creciente variedad de conjuntos de datos. Los últimos tres pasos en particular exigen una gama de datos y funciones analíticas más amplia.

En la actualidad, la inteligencia artificial y el aprendizaje automático están transformando casi todos los sectores, servicios y activos empresariales, y los almacenes de datos no son una excepción. La expansión del big data y la aplicación de nuevas tecnologías digitales están impulsando un cambio en los requisitos y las capacidades de los almacenes de datos.

El almacén de datos autónomo es el último paso en esta evolución y ofrece a las empresas la posibilidad de extraer un valor aún mayor de sus datos, reduciendo además los costes y mejorando la fiabilidad y el rendimiento.

Obtenga más información sobre los almacenes de datos autónomos y empiece a utilizar su propio almacén de datos autónomo.

El diseño de un almacén de datos

Cuando una organización se propone diseñar un almacén de datos, debe comenzar por definir sus requisitos comerciales específicos, acordar el alcance y preparar un diseño conceptual. A partir de aquí, la empresa podrá crear el diseño lógico y físico para el almacén de datos. El diseño lógico abarca las relaciones entre los objetos y el diseño físico consiste en encontrar la mejor manera de almacenar y extraer los objetos. El diseño físico también incluye las tareas de transporte, copia de seguridad y recuperación.

Cualquier diseño de almacén de datos debe incluir los siguientes conceptos:

  • Contenido específico de datos.
  • Relaciones dentro de los grupos de datos y entre ellos.
  • El entorno de sistemas que dará soporte al almacén de datos.
  • Los tipos de transformaciones de datos necesarios.
  • La frecuencia de actualización de los datos.

Un factor primordial en el diseño son las necesidades de los usuarios finales. La mayoría de usuarios finales quiere realizar análisis y ver los datos en conjunto, en lugar de realizar transacciones individuales. Sin embargo, es común que los usuarios finales no tengan claro lo que realmente quieren hasta que surja una necesidad específica. Por lo tanto, el proceso de planificación debe incluir una exploración suficientemente amplia como para prever las necesidades. Finalmente, el diseño del almacén de datos debe dejar espacio para la ampliación y evolución a fin de seguir el paso de las cambiantes necesidades de los usuarios finales.

La nube y el almacén de datos

Los almacenes de datos en la nube ofrecen las mismas características y ventajas que los almacenes de datos in-situ, pero con los beneficios adicionales del cloud computing, como la flexibilidad, la escalabilidad, la agilidad, la seguridad y el coste reducido. Con los almacenes de datos en la nube, las empresas pueden centrarse únicamente en extraer valor de sus datos, en lugar de tener que construir y administrar la infraestructura de hardware y software para dar soporte al almacén de datos.

Más información sobre Oracle Cloud y los almacenes de datos (PDF)

Implementación sencilla: el almacén de datos autónomo

La iteración más reciente del almacén de datos es el almacén de datos autónomo, que se basa en la inteligencia artificial y el aprendizaje automático para eliminar las tareas manuales y simplificar la configuración, la implementación y la gestión de datos. Un almacén de datos autónomo como servicio en la nube no precisa de participación humana en la administración de la base de datos, la configuración o gestión del hardware ni la instalación del software.

La creación del almacén de datos, las copias de seguridad, la aplicación de parches y la actualización, ampliación o reducción de la base de datos se realizan automáticamente y con el mismo coste y la misma flexibilidad, escalabilidad y agilidad que en las plataformas en la nube. El almacén de datos autónomo elimina la complejidad, acelera la implementación y libera recursos para que las empresas puedan centrarse en actividades que aporten valor a la actividad comercial.

Oracle Autonomous Data Warehouse

Oracle Autonomous Data Warehouse es un almacén de datos totalmente autónomo y fácil de usar, con escalabilidad flexible, que ofrece un alto rendimiento en consultas y no requiere administración de la base de datos. La configuración para Oracle Autonomous Data Warehouse es rápida y muy sencilla.

Más información sobre Oracle Autonomous Data Warehouse (PDF)