Подготовка данных

Гибкий доступ к данным

Специалисты по обработке данных могут получать доступ к любому источнику данных и использовать его в любой облачной или локальной среде. Это обеспечивает больше потенциальных возможностей для работы с данными, что способствует улучшению моделей.

Маркировка данных

Oracle Cloud Infrastructure (OCI) Data Labeling представляет сервис для создания размеченных наборов данных, позволяющий точно обучать модели ИИ и машинного обучения. С помощью OCI Data Labeling разработчики и исследователи данных могут собирать данные, создавать и просматривать наборы данных и накладывать метки на записи данных.

Масштабируемая подготовка данных с помощью Spark

Отправка интерактивных запросов Spark в кластер OCI Data Flow Spark. Или используйте Oracle Accelerated Data Science SDK, чтобы легко разработать Spark-приложение, а затем запустить его в широком масштабе на OCI Data Flow, не выходя из среды Data Science.

Хранилище функций (в предварительном просмотре)

Определение конвейеров разработки функций и создание функций с полностью управляемым исполнением. Версии и документирование функций и конвейеров функций. Обменивайтесь, управляйте и контролируйте доступ к функциям. Использование функций как для пакетных сценариев, так и для сценариев внедрения в реальном времени.

Создание модели

Интерфейс JupyterLab

Встроенная среда JupyterLab, размещаемая в облаке, позволяет командам, занимающимся анализом данных, строить и обучать модели с помощью привычного пользовательского интерфейса.

Платформы машинного обучения с открытым кодом.

OCI Data Science обеспечивает удобство и универсальность для специалистов по анализу данных, предлагая сотни популярных инструментов и платформ с открытым исходным кодом, таких как TensorFlow или PyTorch, или добавляя платформы по своему выбору. Стратегическое партнерство между OCI и Anaconda позволяет пользователям OCI бесплатно загружать и устанавливать пакеты непосредственно из репозитория Anaconda, что делает защищенный открытый код еще более доступным, чем раньше.

Библиотека Oracle Accelerated Data Science (ADS)

Oracle Accelerated Data Science SDK - это удобный инструментарий на языке Python, который поддерживает специалиста по исследованию данных на всех этапах его работы.

Обучение модели

Мощное оборудование, включая графические процессоры (GPU)

С помощью графических процессоров NVIDIA специалисты по изучению данных смогут создавать и обучать модели машинного обучения за короткое время. По сравнению с ЦП скорость может увеличиваться в 5-10 раз.

Задания

Используйте задания для выполнения повторяемых задач по анализу данных в пакетном режиме. Масштабируйте обучение по моделям с поддержкой чистых графических процессоров NVIDIA и распределенного обучения.

Редактирование артефактов заданий на консоли

Легко создавайте, редактируйте и запускайте артефакты заданий Data Science прямо из консоли OCI с помощью редактора кода. Интеграция с Git, автоматическое преобразование, персонализация и многое другое.

Управление моделями

Каталог моделей

Специалисты по обработке данных используют каталог моделей для хранения готовых моделей машинного обучения и обмена ими. В каталоге хранятся артефакты и метаданные о таксономии и контексте модели, гиперпараметрах, определениях схем входных и выходных данных модели, а также подробная информация о происхождении модели, включая исходный код и среду обучения.

Оценка и сравнение моделей

Автоматически создавайте исчерпывающий набор показателей и визуализаций для оценки эффективности моделей с учетом новых данных и сравнения моделей-кандидатов .

Воспроизводимые среды

Используйте готовые отобранные среды Conda для решения различных задач, таких как NLP, компьютерное зрение, прогнозирование, анализ графов и Spark. Публикуйте пользовательские среды и делитесь ими с коллегами, обеспечивая воспроизводимость обучающих и аналитических сред.

Управление версиями

Специалисты по изучению данных могут подключаться к репозиторию Git своей организации для сохранения и извлечения работы машинного обучения.

Автоматизация и MLOps

Развертывание управляемой модели

Развертывайте модели машинного обучения в качестве конечных точек HTTP для обслуживания прогнозов моделей на новых данных в режиме реального времени. Просто нажмите для развертывания из каталога моделей, и OCI Data Science обработает все операции инфраструктуры, включая инициализацию вычислений и балансировку нагрузки.

Конвейеры машинного обучения

Используйте на практике и автоматизируйте процессы разработки, обучения и развертывания моделей с помощью полностью управляемого сервиса для разработки, отладки, отслеживания и выполнения конвейеров машинного обучения.

Мониторинг машинного обучения

Непрерывный мониторинг моделей в производственной среде при модификации данных и концепций. Позволяет специалистам по обработке данных, инженерам по надежности на месте использования и инженерам DevOps получать оповещения и быстро оценивать потребности в переобучении моделей.

Приложения для машинного обучения

Разработанные специально для собственных приложений SaaS от Oracle, встраивающие функции AI, приложения машинного обучения теперь доступны для автоматизации всего жизненного цикла MLOps, включая разработку, предоставление ресурсов, текущее обслуживание и управление парком транспортных средств, для независимых разработчиков программного обеспечения с сотнями моделей для каждой из тысяч клиентов.