Озеро данных

Озеро данных — это репозиторий структурированных, частично структурированных и неструктурированных данных в любых форматах, размерах и масштабах, которые можно легко анализировать. Oracle Cloud Infrastructure (OCI) позволяет создать безопасное, экономичное и простое в управлении озеро данных. Озеро данных в OCI тесно интегрируется с предпочтительными хранилищами данных и средствами аналитики, а также с другими сервисами OCI, такими как каталог данных, сервисы безопасности и наблюдения.

Что такое озеро данных? (0:44)
Любые данные, любой источник

С легкостью переносите данные в пакетах или потоках в озеро данных OCI, где их можно анализировать. Используйте OCI Data Integration, OCI GoldenGate или OCI Streaming для приема данных и их сохранения в хранилище объектов OCI.

Прощайте, устаревшие технологии!

Центральное озеро данных в OCI интегрируется с Вашими предпочтительными инструментами, в том числе с базами данных, такими как Oracle Autonomous Data Warehouse, MySQL HeatWave, средствами аналитики и машинного обучения (ML), такими как Oracle Analytics Cloud, и проектами с открытым исходным кодом, такими как Apache Spark.

Использование технологий искусственного интеллекта и машинного обучения

Комплексный набор сервисов искусственного интеллекта и машинного обучения позволяет получать новые аналитические данные, делать прогнозы, снижать операционные издержки и повышать качество обслуживания клиентов.

Обнаружение и защита данных

Каталогизируйте свои данные и собирайте аналитическую информацию об озере данных с помощью каталога данных OCI. Подключите средства выполнения запросов и базы данных для обнаружения и запроса данных в хранилище объектов.

Получите ранний доступ к озеру данных OCI

Oracle Cloud Infrastructure в этом году запускает полностью управляемый сервис озера данных под названием OCI Data Lake. Вы можете зарегистрироваться для получения раннего доступа, чтобы изучить его функции и возможности до выпуска в открытый доступ.

Преимущества озера данных в OCI


Модернизация озера данных

Озеро данных позволяет работать с большим количеством видов данных, но для управления им может потребоваться столько времени и усилий, что его использование станет невыгодным. Предлагая полностью управляемые сервисы озер данных с открытым кодом, OCI позволяет сократить расходы и трудозатраты по управлению. Таким образом, OCI обеспечивает сокращение операционных затрат, улучшение масштабируемости и безопасности, а также возможности объединения всех Ваших данных.


Расширение хранилища данных

Хранилища данных и витрины данных крайне важны для успешного развития бизнеса. Интеграция с озером данных еще больше повышает их ценность. Интеграция баз данных, хранилищ данных и озера данных с Oracle означает, что можно получать доступ к данным из нескольких расположений с помощью одного запроса SQL. Имеющиеся приложения и инструменты получают прозрачный доступ ко всем данным; не нужно ничего менять и осваивать новые навыки.


Использование продвинутой аналитики для приложений Oracle

Корпоративные приложения генерируют очень ценные данные, но их мало кто использует в полной мере. Озеро данных в OCI упрощает доступ к данным из разных приложений и позволяет проводить сложный анализ, от которого может зависеть, насколько успешным будет очередной финансовый квартал.

Интегрированное решение озера данных в OCI

Централизация данных с помощью встроенного интерфейса интеграции данных OCI.

Возможность запроса любых данных из любого источника без репликации.

Предварительно интегрированные приложения для мгновенной окупаемости.

Каталогизация и управление с помощью встроенного интерфейса каталога данных OCI.

Защита данных с помощью детализированных политик управления доступом на основе ролей.

Платформа данных Oracle позволяет раскрыть весь потенциал Ваших данных

  • Объединяйте операционные и аналитические данные, избегая разрозненности.
  • Используйте Oracle IaaS, Oracle SaaS или что-то среднее между ними для контроля.
  • Переносите на платформу любые данные: мы устраняем барьеры между структурированными и неструктурированными данными.
  • Изучите возможности OCI и открытость этой инфраструктуры для других поставщиков облачных сервисов: она всегда будет с Вами.
  • Используйте лучшую отчетность Oracle Analytics Cloud или любое стороннее приложение аналитики: OCI поддерживает все.
Обзорная схема платформы данных Oracle, см. описание ниже На схеме представлена платформа данных Oracle с источниками данных, сервисами перемещения данных, такими как сервисы интеграции, ядром современной платформы данных Oracle, а также возможными результатами и сервисами разработки приложений.

Интеграция Autonomous Database с озерами данных

Oracle Autonomous Database поддерживает интеграцию с озерами данных не только в Oracle Cloud Infrastructure, но и в Amazon Web Services (AWS), Microsoft Azure, Google Cloud и других средах. Можно загружать данные в базу данных или выполнять запрос данных непосредственно в исходном хранилище объектов. Оба подхода для доступа к данным используют одинаковые инструменты и API.

Эта архитектура иногда называется архитектурой озерного хранилища.



Схема Autonomous Database с озерами данных, описание см. ниже На схеме представлена архитектура платформы данных, использующей Oracle Autonomous Database, с источниками данных, Oracle Autonomous Database и результатами.

Анализ всех Ваших данных в реальном времени с помощью MySQL HeatWave Lakehouse

Один облачный сервис баз данных MySQL для транзакций, аналитики в реальном времени по хранилищам и озерам данных, а также машинного обучения — все просто, без задержек, рисков и затрат на дублирование операций извлечения, преобразования и загрузки (ETL).

*Общедоступные тесты см. здесь.



Схема Autonomous Database с озерами данных, описание см. ниже На схеме представлена архитектура платформы данных, использующей Oracle MySQL HeatWave, с источниками данных, MySQL HeatWave и результатами.

Создание озера данных с помощью управляемых Oracle сервисов с открытым исходным кодом

Быстро создавайте озера данных на основе Hadoop или Spark для расширения хранилищ данных, а также обеспечения доступности всех данных и экономически эффективного управления ими.



Схема Autonomous Database с озерами данных, описание см. ниже На схеме представлена архитектура платформы данных, использующей управляемые Oracle сервисы с открытым исходным кодом, такие как Hadoop, Spark и OpenSearch, с источниками данных, сервисами Oracle с открытым исходным кодом в ядре и возможными результатами.

Сервисы озер данных от Oracle

Перемещение и интеграция данных

Подключайте и расширяйте аналитические приложения, используя согласованные в режиме реального времени транзакционные данные, эффективные пакетные загрузки и потоковые данные.

  • OCI Data Integration
    Упростите сложные процедуры извлечения, преобразования и загрузки процессов (ETL и E-LT) в хранилища и озера данных для обработки и анализа с помощью конструктора, не требующего работы с кодом.
  • Oracle Data Integrator
    Data Integrator обеспечивает расширенные возможности миграции данных для их извлечения, преобразования и загрузки. Oracle Data Integrator оптимизирован как для облачных, так и для локальных баз данных Oracle.
  • Oracle GoldenGate
    Oracle GoldenGate обеспечивает высокую доступность, интеграцию данных в режиме реального времени, сбор изменений в данных, репликацию данных, преобразования и проверку между операционными и аналитическими корпоративными системами.
  • OCI Streaming
    Этот сервис предоставляет готовые интеграции сотен сторонних продуктов в таких категориях, как DevOps, базы данных, большие данные и приложения SaaS.

Озеро данных

Создайте озеро данных с помощью полностью управляемых сервисов данных с меньшими затратами и меньшими усилиями.

  • Озеро данных OCI
    DData Lake предлагает централизованное хранение и метаданные для структурированных и неструктурированных данных с унифицированным и детализированным контролем доступа.
  • OCI Object Storage
    Object Storage позволяет заказчикам хранить данные любого типа в исходном формате. Идеальный вариант для создания современных приложений, требующих гибкости и возможностей масштабирования.
  • OCI Data Catalog
    Data Catalog помогает специалистам по работе с данными во всей организации находить и изучать данные, а также управлять ими, используя каталог активов данных всего предприятия.
  • OCI Data Flow
    Data Flow — это полностью управляемый сервис Apache Spark для выполнения задач обработки экстремально больших наборов данных без необходимости развертывания соответствующей инфраструктуры и управления ею. Это дает возможность быстро поставлять приложения, поскольку разработчики могут сосредоточиться непосредственно на разработке и не отвлекаться на управление инфраструктурой.
  • Oracle Big Data
    Big Data Service — это сервис озер данных на базе Hadoop для хранения и анализа больших объемов необработанных данных клиентов. Управляемый сервис Oracle Big Data Service поставляется с полностью интегрированным стеком, включающим в себя инструменты с открытым исходным кодом и инструменты с добавленной стоимостью от Oracle, упрощающие ИТ-операции.

Озерное хранилище

Используйте интеграцию OCI озер данных с предпочтительными хранилищами данных и извлекайте новую информацию.

  • MySQL Heatwave Lakehouse
    MySQL HeatWave Lakehouse прозрачно подключается к озерам данных, предоставляя пользователям возможность обрабатывать и запрашивать сотни терабайт данных в хранилище объектов в различных форматах файлов, таких как CSV, Parquet и резервные копии Aurora/Redshift.
  • Возможности озерного хранилища Autonomous Database
    Autonomous Database предоставляет самоуправляемое озерное хранилище, дающее пользователям возможность загружать или напрямую запрашивать файлы в любом хранилище объектов (включая OCI, AWS, Azure и Google Cloud Platform). Интегрированная аналитика на основе машинного обучения, анализа пространственных данных, текста и графов позволяет получать аналитические данные без их перемещения.

ИИ и машинное обучение

Анализируйте данные, используя готовые модели ИИ или создавайте свои собственные.

  • OCI AI Services
    AI Services — это набор сервисов с готовыми моделями машинного обучения, с которыми разработчикам проще применять средства искусственного интеллекта в приложениях и бизнес-операциях. Эти модели можно обучить с учетом потребностей заказчика, чтобы получать более точные результаты.
  • OCI Data Science
    Быстро создавайте, обучайте, развертывайте модели обучения и управляйте ими, используя сервисы сбора и анализа данных, созданные для командной работы.
  • Машинное обучение в СУБД Oracle Database
    Машинное обучение в СУБД Oracle Database поддерживает исследование данных, подготовку и моделирование машинного обучения в любом масштабе.
  • MySQL HeatWave AutoML
    Машинное обучение MySQL HeatWave AutoML включает все, что требуется пользователям для построения, обучения, развертывания и объяснения моделей машинного обучения в MySQL HeatWave без дополнительных затрат.
Финансовые сервисы
Experian ускорила финансовую инклюзивность при помощи озерного хранилища в OCI.
Горное дело
Компания MineSense в пять раз ускорила обработку запросов благодаря озерному хранилищу в OCI.
Реклама
Beso унифицировала данные из 23 онлайн-источников и объединила их с офлайн-источниками, создав озеро, охватывающее в сумме 100 источников данных.
Спортивные технологии
Благодаря озерному хранилищу Oracle, Seattle Sounders обрабатывает в 100 раз больше данных, получает аналитические выводы в 10 раз быстрее и тратит меньше сил на управление базами данных.

Экосистема партнеров, работающих с озерными хранилищами

Решения партнеров Oracle поддерживают и расширяют возможности озерных хранилищ в OCI.

  • Логотип Accenture
  • Логотип Capgemini
  • Логотип Deloitte
  • Логотип h2o.ai
  • Логотип qubix
  • Логотип Reply Technology
  • Логотип Sesame Software
  • Логотип wandisco

Informatica — приоритетный партнер в сфере интеграции данных и решений для управления хранилищами данных и озерными хранилищами.

Внедрение озера данных в Oracle Cloud Infrastructure

Просмотр всех эталонных архитектур
Серия Oracle Playbook

Мы собрали все секреты нашей стратегии в отношении сотрудников, процессов и систем. И мы хотим поделиться ими с Вами.

Начало работы с озером данных в OCI

Опробуйте облачные сервисы Always Free и получите пробную версию на 30 дней

Oracle предлагает бесплатную версию без ограничений по времени для ряда сервисов, включая Autonomous Data Warehouse, OCI Compute и Oracle Storage, а также выделяет бесплатный кредит в размере 300 долларов США для пробного использования дополнительных облачных сервисов. Узнайте подробности и зарегистрируйтесь бесплатно уже сегодня.

  • Что предлагается в рамках уровня Oracle Cloud Free Tier?

    • Always Free
    • 2 автономные базы данных, объемом 20 ГБ каждая
    • Вычислительные виртуальные машины
    • Блочное хранилище объемом 100 ГБ
    • Объектное хранилище на 10 ГБ

Учитесь на практических тренингах

Лучший способ научиться — попробовать самому. Посмотрите этот бесплатный семинар по озеру данных, в котором показаны типичные сценарии использования и некоторые инструменты, которые можно применять для создания озера данных.

  • Получайте доступ к озеру данных через Autonomous Database и Data Catalog

    На практических занятиях этого семинара вы научитесь получать доступ к озеру данных, созданному на основе сегментов объектного хранилища Oracle, через Oracle Autonomous Database и OCI Data Catalog.

    Начать бесплатное практическое занятие по доступу к озерам данных
  • Начало работы с Oracle Big Data Service

    Узнайте, как создать и контролировать высокодоступный кластер Hadoop, используя Oracle Big Data Service и OCI. Вы также добавите Oracle Cloud SQL в кластер, настроите доступ к служебному и основному узлу и узнаете, как использовать менеджер Cloudera и Hue для доступа к кластеру напрямую из браузера.

    Начать практическое занятие по озерам данных
  • Изучение аналитики и машинного обучения с Red Bull Racing

    Используйте аналитику и машинное обучение для анализа данных о гонках за 70 лет. Узнайте, почему одни гонки настолько захватывающие, что невозможно отвести взгляд, а другие более предсказуемы.

    Начать практическое занятие по аналитике данных
  • Начало работы с Oracle Cloud Infrastructure Anomaly Detection

    Узнайте, как использовать OCI Anomaly Detection для создания пользовательских моделей машинного обучения. Вы возьмете данные, загруженные пользователями, примените специализированный алгоритм для обучения модели и развернете обученную модель в облачной среде для выявления аномалий.

    Начать практическое занятие по выявлению аномалий

Связаться с отделом продаж

Хотите узнать больше об озере данных? Позвольте одному из экспертов Oracle помочь.

  • Они могут ответить на такие вопросы, как:

    • Как начать работу с озером данных в Oracle?
    • В чем заключаются преимущества озера данных по сравнению с хранилищем данных?
    • Какие преимущества может дать озеро данных моему бизнесу?