No se han encontrado resultados

Su búsqueda no coincide con ningún resultado.

Le sugerimos que pruebe lo siguiente para poder encontrar lo que está buscando:

  • Verifique la ortografía de su búsqueda de palabras clave.
  • Utilice sinónimos para la palabra clave que escribió; por ejemplo, intente con “aplicación” en lugar de “software”.
  • Pruebe con una de las búsquedas populares que se muestran a continuación.
  • Comience una nueva búsqueda.
Tendencias de preguntas

¿Qué es una base de datos orientada a grafos?

Bases de datos orientadas a grafos

Una base de datos orientada a grafos es una plataforma especializada y de un solo propósito para crear y manipular grafos. Los grafos contienen nodos, bordes y propiedades que se utilizan para representar y almacenar datos de una forma que no permiten las bases de datos relacionales.

La analítica de grafos es otro término de uso común y hace referencia específicamente al proceso de analizar datos en un formato de grafo utilizando los puntos de datos como nodos y las relaciones como bordes. Para la analítica de grafos se precisa una base de datos que admita formatos de grafos; por ejemplo, una base de datos orientada a grafos dedicada o una base de datos multimodelo que admita varios modelos de datos, incluidos los grafos.

¿Qué es un grafo?

Un grafo es una colección de puntos (vértices) y las líneas entre esos puntos (bordes). Los grafos permiten a los usuarios modelar los datos basándose en las relaciones de forma más natural e intuitiva que la habitual con las bases de datos relacionales.

En el siguiente ejemplo, los vértices son Melli, Jean, John, Lucy y Sophie y los bordes que denotan las relaciones son “colabora con” y “pugna con”.

Bases de datos orientadas a grafos

El formato de grafo proporciona una plataforma mucho más flexible para detectar conexiones distantes o analizar datos en función de aspectos como la fuerza o la calidad de la relación. Al buscar una relación indirecta entre dos puntos de datos, lo natural en la lógica de un formato de grafo es una plataforma más eficiente para completar esta tarea.

Los grafos le permiten explorar y descubrir conexiones y patrones en redes sociales, IoT, big data, almacenes de datos y también datos de transacciones complejas para múltiples casos de uso comercial, incluida la detección de fraudes en la banca, el descubrimiento de conexiones en redes sociales y la vista integral del cliente. En la actualidad, los grafos se utilizan cada vez más como parte de la ciencia de los datos para hacer más claras las conexiones en las relaciones.

Los algoritmos de grafos —operaciones diseñadas específicamente para analizar relaciones y comportamientos entre datos en grafos— permiten comprender cosas que resultan difíciles de ver con otros métodos. Por ejemplo, los algoritmos de grafos pueden identificar qué individuo o elemento está más conectado con otros en las redes sociales o los procesos comerciales. Los algoritmos pueden identificar comunidades, anomalías, patrones comunes y rutas que conectan individuos o transacciones relacionadas.

Conceptos básicos de las bases de datos orientadas a grafos

Las bases de datos orientadas a grafos convierten los datos a un formato de grafo, independientemente del modelo de datos del que se extraen. En un formato de grafo, los activos clave son los registros (nodos o vértices) y las conexiones entre los registros (bordes, vínculos o relaciones). Dado que es posible crear conexiones (bordes) entre dos o muchos nodos, se abre además la puerta a todo tipo de análisis dimensionales.

La siguiente imagen ofrece una representación visual de una consulta de ejemplo con la analítica de grafos. En este ejemplo, todos los registros están representados por puntos. De forma predeterminada, todos los puntos son azules. Cuando se realiza una consulta, los registros resultantes y sus respectivas conexiones se muestran en rojo. Las bases de datos orientadas a grafos permiten realizar conexiones casi ilimitadas para ayudar a identificar patrones y detectar anomalías.

Conceptos básicos de las bases de datos orientadas a grafos 1

Un ejemplo sencillo del mundo real de lo que se puede lograr con una base de datos orientada a grafos es determinar las direcciones en un mapa de principio a fin. Puede imaginar que cada intersección es un nodo y cada calle es un borde. Entonces, la consulta consiste en determinar la mejor ruta para ir de A a B. Además, puede tenerse en cuenta la fuerza/calidad de la conexión como tráfico. Todo esto se puede incluir al procesar la consulta (ver el ejemplo a continuación):

Conceptos básicos de las bases de datos orientadas a grafos 2

¿Cómo se puede utilizar una base de datos orientada a grafos?

Las bases de datos orientadas a grafos son una herramienta extremadamente flexible y potente. Gracias al formato del grafo, se pueden determinar relaciones complejas para obtener información más completa con mucho menos esfuerzo. Las bases de datos de grafos generalmente ejecutan consultas en lenguajes como Property Graph Query Language (PGQL). El siguiente ejemplo muestra la misma consulta en PGQL y SQL.

Uso de la analítica de grafos

Como se ve en el ejemplo anterior, el código PGQL es más simple y mucho más eficiente. Dado que los grafos enfatizan las relaciones entre los datos, resultan ideales para varios tipos de análisis diferentes. En particular, las bases de datos orientadas a grafos destacan por:

  • Encontrar la ruta más corta entre dos nodos
  • Determinar los nodos que crean la mayor actividad/influencia
  • Analizar la conectividad para identificar los puntos más débiles de una red
  • Analizar el estado de la red o comunidad según la distancia/densidad de conexión en un grupo

Un ejemplo sencillo de la analítica de grafos en acción es la siguiente imagen, que muestra una representación visual del popular juego "Número de Bacon". Para los que no lo conozcan, este juego establece conexiones entre Kevin Bacon y otro actor basándose en una cadena de películas en común. Este énfasis en las relaciones lo convierte en la forma ideal de mostrar la analítica de grafos.

Imagine un conjunto de datos con dos categorías de nodos: todas las películas que se han hecho y todos los actores que han participado en esas películas. A continuación, con el grafo, ejecutamos una consulta pidiendo conectar a Kevin Bacon con la teleñeco Cerdita Peggy. El resultado sería el siguiente:

Imagen de caso de uso de analítica de grafos 1

En este ejemplo, los nodos disponibles (vértices) son tanto actores como películas y las relaciones (bordes) son el estado de "ha actuado". A partir de aquí, la consulta devuelve los siguientes resultados:

  • Kevin Bacon actuó en Río salvaje con Meryl Streep.
  • Meryl Streep actuó en Una serie de catastróficas desdichas de Lemony Snicket con Billy Connolly.
  • Billy Connolly actuó en Los teleñecos en la Isla del Tesoro con la Cerdita Peggy.

Con las bases de datos orientadas a grafos se pueden consultar muchas relaciones diferentes con este ejemplo de Kevin Bacon, como:

  • "¿Cuál es la cadena más corta para conectar a Kevin Bacon con la Cerdita Peggy?" (análisis de la ruta más corta, de la forma utilizada en el juego del Número de Bacon anterior)
  • "¿Quién ha trabajado con el mayor número de actores?" (grado de centralidad)
  • "¿Cuál es la distancia media entre Kevin Bacon y todos los demás actores?" (centralidad de cercanía)

Este es, por supuesto, un ejemplo más divertido que la mayoría de los usos de la analítica de grafos. Pero este enfoque funciona en casi todos los big data, en cualquier situación en la que un gran número de registros muestre una conectividad natural entre sí. Algunos de los usos más populares de la analítica de grafos son el análisis de redes sociales, las redes de comunicación, el tráfico y el uso de sitios web, los datos reales de carreteras y las transacciones y cuentas financieras.

Caso de uso de las bases de datos orientadas a grafos: Exclusión de la desinformación y bots en redes sociales

Las bases de datos orientadas a grafos se pueden usar en muchos escenarios diferentes, pero normalmente se utilizan para analizar redes sociales. De hecho, las redes sociales son el caso de uso ideal, ya que en ellas intervienen un gran volumen de nodos (cuentas de usuario) y conexiones multidimensionales (interacciones en muchas direcciones diferentes). En un análisis de grafos de una red social se puede determinar:

  • En qué medida están activos los usuarios. (número de nodos)
  • Qué usuarios tienen más influencia. (densidad de conexiones)
  • Quién tiene el mayor número de interacciones bidireccionales. (dirección y densidad de conexiones)

Sin embargo, esta información no resulta útil si los bots la sesgan de forma no natural. Afortunadamente, la analítica de grafos puede ser un método excelente para identificar y filtrar bots.

En un caso de uso real, el equipo de Oracle utilizó Oracle Marketing Cloud para evaluar la publicidad y las tracciones de redes sociales, en particular para identificar las cuentas de bot falsas que sesgaban los datos. El comportamiento más habitual de estos bots consistía en retuitear las cuentas objetivo, inflando así su popularidad artificialmente. Un análisis de patrones sencillo permitió evaluar el uso de la cuenta de retweets y la densidad de conexiones con los vecinos. Se detectó que las cuentas populares de manera natural tenían relaciones diferentes con los vecinos que las cuentas controladas por bots.

Esta imagen muestra cuentas populares de manera natural.

Imagen de caso de uso de bases de datos orientadas a grafos 2

Y esta imagen muestra el comportamiento de una cuenta controlada por un bot.

Imagen de caso de uso de bases de datos orientadas a grafos 3

La clave aquí es usar las capacidades de la analítica de grafos para diferenciar un patrón natural de un patrón de bot. A partir de ahí, es tan simple como filtrar esas cuentas, aunque también es posible profundizar para examinar la relación entre los bots y las cuentas retuiteadas.

Imagen de caso de uso de bases de datos orientadas a grafos 4

Las redes hacen todo lo posible por eliminar las cuentas de bot, ya que afectan la experiencia general de su base de usuarios. Para verificar que este proceso de detección de bots era preciso, las cuentas marcadas se verificaron transcurrido un mes. Los resultados fueron los siguientes:

  • Suspendidas: 89%
  • Eliminadas: 2.2%
  • Aún activas: 8.8%

El porcentaje extremadamente alto de cuentas sancionadas (91,2 %) mostró la precisión tanto de la identificación de patrones como del proceso de limpieza. Este proceso habría sido mucho más largo con una base de datos tabular estándar; sin embargo, con la analítica de grafos, se pueden identificar patrones complejos de forma rápida.

Caso de uso de las bases de datos orientadas a grafos: Fraude con tarjetas de crédito

Los grafos se han convertido en una poderosa herramienta en la industria de las finanzas para detectar el fraude. A pesar de los avances en la tecnología antifraude, como el uso de chips integrados en las tarjetas, el fraude aún puede producirse de diversas formas. Los dispositivos de rastreo pueden robar los datos de las bandas magnéticas, una técnica que se usa comúnmente en lugares que aún no han instalado lectores de chips. Una vez que se almacenan esos datos, se pueden cargar en una tarjeta falsa para realizar compras o retirar dinero.

La identificación de patrones suele ser la primera línea de defensa de los medios de detección de fraudes. Los patrones de compra esperados se basan en la ubicación, la frecuencia, los tipos de tiendas y otros elementos que se ajustan al perfil de un usuario. Cuando algo parece totalmente anómalo —por ejemplo, una persona que normalmente se encuentra en el área de la Bahía de San Francisco y que, de repente, hace compras nocturnas en Florida— se marca como potencialmente fraudulento.

La potencia informática requerida para ello se simplifica mucho con la analítica de grafos. La analítica de grafos es excelente para definir patrones entre nodos; en este caso, las categorías de nodos se definen como cuentas (titulares de tarjetas), ubicaciones de compra, categoría de compra, transacciones y terminales. Es fácil identificar patrones de comportamiento naturales; por ejemplo, en un mes determinado, una persona podría:

  • Comprar comida para mascotas (categoría de compra) en diferentes tiendas de mascotas (terminales)
  • Pagar en restaurantes durante los fines de semana (metadatos de transacciones) en la región (lugares de compra)
  • Comprar artículos de bricolaje (categoría de compra) en una ferretería local (ubicación de la cuenta, ubicación de compra)

La detección de fraude generalmente se realiza con aprendizaje automático, pero la analítica de grafos puede complementar esta tarea para crear un proceso más preciso y eficiente. Gracias al enfoque en las relaciones, los resultados se han convertido en indicadores efectivos para determinar y marcar registros fraudulentos, seleccionando y preparando los datos antes de que puedan utilizarse.

El futuro de las bases de datos orientadas a grafos

Las bases de datos orientadas a grafos y las técnicas de grafos han ido evolucionando al ritmo de la potencia informática y los big data se han impulsado durante la última década. De hecho, cada vez está más claro que se convertirán en la herramienta estándar para analizar un nuevo mundo de relaciones complejas entre los datos. A medida que las empresas y las organizaciones continúan impulsando las capacidades de los big data y el análisis, la posibilidad de obtener información de formas cada vez más complejas hace que las bases de datos orientadas a grafos resulten imprescindibles para las necesidades actuales y los éxitos del mañana.