Специалисты по обработке данных могут получать доступ к любому источнику данных и использовать его в любой облачной или локальной среде. Это обеспечивает больше потенциальных возможностей для работы с данными, что способствует улучшению моделей.
Oracle Cloud Infrastructure (OCI) Data Labeling представляет сервис для создания размеченных наборов данных, позволяющий точно обучать модели ИИ и машинного обучения. С помощью OCI Data Labeling разработчики и исследователи данных могут собирать данные, создавать и просматривать наборы данных и накладывать метки на записи данных.
Отправка интерактивных запросов Spark в кластер OCI Data Flow Spark. Или используйте Oracle Accelerated Data Science SDK, чтобы легко разработать Spark-приложение, а затем запустить его в широком масштабе на OCI Data Flow, не выходя из среды Data Science.
Определение конвейеров разработки функций и создание функций с полностью управляемым исполнением. Версии и документирование функций и конвейеров функций. Обменивайтесь, управляйте и контролируйте доступ к функциям. Использование функций как для пакетных сценариев, так и для сценариев внедрения в реальном времени.
Встроенная среда JupyterLab, размещаемая в облаке, позволяет командам, занимающимся анализом данных, строить и обучать модели с помощью привычного пользовательского интерфейса.
OCI Data Science обеспечивает удобство и универсальность для специалистов по анализу данных, предлагая сотни популярных инструментов и платформ с открытым исходным кодом, таких как TensorFlow или PyTorch, или добавляя платформы по своему выбору. Стратегическое партнерство между OCI и Anaconda позволяет пользователям OCI бесплатно загружать и устанавливать пакеты непосредственно из репозитория Anaconda, что делает защищенный открытый код еще более доступным, чем раньше.
Oracle Accelerated Data Science SDK - это удобный инструментарий на языке Python, который поддерживает специалиста по исследованию данных на всех этапах его работы.
С помощью графических процессоров NVIDIA специалисты по изучению данных смогут создавать и обучать модели машинного обучения за короткое время. По сравнению с ЦП скорость может увеличиваться в 5-10 раз.
Используйте задания для выполнения повторяемых задач по анализу данных в пакетном режиме. Масштабируйте обучение по моделям с поддержкой чистых графических процессоров NVIDIA и распределенного обучения.
Легко создавайте, редактируйте и запускайте артефакты заданий Data Science прямо из консоли OCI с помощью редактора кода. Интеграция с Git, автоматическое преобразование, персонализация и многое другое.
Специалисты по обработке данных используют каталог моделей для хранения готовых моделей машинного обучения и обмена ими. В каталоге хранятся артефакты и метаданные о таксономии и контексте модели, гиперпараметрах, определениях схем входных и выходных данных модели, а также подробная информация о происхождении модели, включая исходный код и среду обучения.
Автоматически создавайте исчерпывающий набор показателей и визуализаций для оценки эффективности моделей с учетом новых данных и сравнения моделей-кандидатов .
Используйте готовые отобранные среды Conda для решения различных задач, таких как NLP, компьютерное зрение, прогнозирование, анализ графов и Spark. Публикуйте пользовательские среды и делитесь ими с коллегами, обеспечивая воспроизводимость обучающих и аналитических сред.
Специалисты по изучению данных могут подключаться к репозиторию Git своей организации для сохранения и извлечения работы машинного обучения.
Развертывайте модели машинного обучения в качестве конечных точек HTTP для обслуживания прогнозов моделей на новых данных в режиме реального времени. Просто нажмите для развертывания из каталога моделей, и OCI Data Science обработает все операции инфраструктуры, включая инициализацию вычислений и балансировку нагрузки.
Используйте на практике и автоматизируйте процессы разработки, обучения и развертывания моделей с помощью полностью управляемого сервиса для разработки, отладки, отслеживания и выполнения конвейеров машинного обучения.
Непрерывный мониторинг моделей в производственной среде при модификации данных и концепций. Позволяет специалистам по обработке данных, инженерам по надежности на месте использования и инженерам DevOps получать оповещения и быстро оценивать потребности в переобучении моделей.
Разработанные специально для собственных приложений SaaS от Oracle, встраивающие функции AI, приложения машинного обучения теперь доступны для автоматизации всего жизненного цикла MLOps, включая разработку, предоставление ресурсов, текущее обслуживание и управление парком транспортных средств, для независимых разработчиков программного обеспечения с сотнями моделей для каждой из тысяч клиентов.