Oracle Cloud Infrastructure Speech — это новый сервис обработки речи на основе ИИ, который использует технологию автоматического распознавания речи Automatic Speech Recognition (ASR) для преобразования речи в текст. Опираясь на те же модели ИИ, что реализованы в Oracle Digital Assistant, разработчики могут использовать проверенные временем акустические и языковые модели Oracle, чтобы обеспечить высокоточную транскрипцию аудио- или видеофайлов на разных языках.
** На сегодняшний день продукт доступен ограниченно
OCI Speech использует автоматическое распознавание речи — процесс глубокого обучения, который обеспечивает точную транскрипцию живой речи. Благодаря готовым акустическим и языковым моделям начать работу очень просто, даже не имея опыта в сфере интеллектуальной обработки данных.
Поиск, индексация и дешифровка данных, которые содержатся в ваших аудиофайлах. Преобразование аудиозаписей диалогов в текст для анализа с помощью сервисов искусственного интеллекта. Например, можно использовать OCI Language для анализа тональности текста, а возможности OCI Speech по выявлению отклонений — для прогнозирования оттока клиентов.
Модели ASR OCI Speech поддерживают английский, испанский и португальский языки, так что вы можете транскрибировать аудиозаписи на нужном языке.
Откажитесь от использования сторонних предложений по транскрипции и улучшите контроль над своими данными, укрепив защиту и соблюдая нормативные требования.
OCI Speech — это универсальный сервис, который можно вызывать с помощью REST API, различных SDK и Oracle CLI. Разработчики могут без труда развернуть масштабируемый сервис распознавания речи, не имея опыта в области data science или машинного обучения.
Oracle Cloud Infrastructure Speech обеспечивает конфиденциальность данных заказчика. Готовые модели автоматического распознавания речи транскрибируют ваш контент, но не сохраняют никакие данные для обучения, отладки или иных целей.
OCI Speech использует собственные модели и инфраструктуру, которые позволяют быстро преобразовывать речь в текст.
Мы добавили оценку достоверности на уровне слова, чтобы вам было проще обнаружить слова, которые могли быть затранскрибированы с ошибками. Используйте оценку достоверности на уровне слов, чтобы определить, на что обратить особое внимание при создании приложения.
Мы добавили готовый фильтр, который использует подготовленный список нецензурной лексики. Нецензурные слова можно скрыть, удалить или отметить тегом.
Автоматически предоставляйте субтитры в рабочих процессах на платформе OCI для всего содержимого, созданного и отбираемого сервисом цифровых мультимедийных материалов. Индексируйте контент с помощью OCI Speech, чтобы было удобнее и проще искать содержимое.
OCI Speech может транскрибировать вызовы заказчиков, чтобы было легко выполнять поиск и извлекать нужную информацию. OCI Language и Anomaly Detection вместе позволяют определять настроение, прогнозировать отток заказчиков и выявлять возможности для обучения персонала.
Мы предлагаем множество документов для сервиса OCI Speech. Узнайте, как создавать задачи по транскрибированию, использовать инструменты для разработчиков и многое другое.
Получите ответы на вопросы о сервисе OCI Speech, перейдя по ссылке ниже.
Гай Микаэли (Guy Michaeli), старший менеджер по продуктам,
Сегодня мы с радостью представляем вам три новые возможности, которые теперь доступны в сервисе Speech без дополнительной платы. Это встроенная поддержка аудиофайлов с частотой дискретизации 8 кГц, поддержка вывода в формат SRT (формат субтитров) и автоматическая расстановка знаков препинания в полученном тексте. Эти новые функции теперь доступны во всех регионах коммерческого распространения OCI. Мы подготовили это обновление в рамках непрекращающейся работы по созданию доступного сервиса высококачественного транскрибирования.
Читать статью полностьюСоздавайте, тестируйте и развертывайте приложения в Oracle Cloud бесплатно.
Ответы на любые вопросы об OCI Speech.