국가

AI 음성 인식

OCI Speech는 오디오 기반 콘텐츠를 텍스트로 변환해주는 ASR(자동 음성 인식) 기술을 적용한 AI 서비스입니다. 개발자는 간편하게 API 호출을 생성하여 OCI Speech의 사전 학습된 모델을 애플리케이션에 통합할 수 있습니다. OCI Speech를 사용하면 콘솔, REST API, 명령줄 인터페이스 또는 SDK를 통해 표준 텍스트로 작성된, 정확하고 타임 스탬프가 지정된 전사본을 생성할 수 있습니다. 또한 OCI Data Science Notebook 세션에서도 OCI Speech를 사용할 수 있습니다. OCI Speech를 사용하면 비속어까지 걸러낼 수 있어, 단일 단어는 물론 전체 대본을 신뢰할 수 있습니다.

OCI Speech 특징

사전 구축된 음향 및 언어 모델

OCI Speech는 딥 러닝 프로세스인 자동 음성 인식 기능을 사용해 일상적인 대화로부터 정확도 높은 대본을 생성해냅니다. 사용자는 데이터 과학 관련 경험이 없어도 사전 구축된 음향 및 언어 모델을 사용해 손쉽게 작업을 시작할 수 있죠.

오디오 및 비디오 파일의 데이터 분석

오디오 파일에 파묻힌 데이터를 검색, 인덱스화 및 해독할 수 있습니다. 기록된 음성 대화를 텍스트 데이터로 변환하여 이를 AI 서비스를 활용해 분석하죠. 예를 들어, OCI Language를 사용해 대화 속 감정을 포착하고, OCI Speech의 이상 감지 기능을 사용해 고객 이탈 가능성을 식별할 수 있습니다.

다국어 기본 지원

OCI Speech ASR 모델은 영어, 스페인어, 포르투갈어 등 여러 언어를 지원하기 때문에, 원하는 언어로 오디오 파일을 전사할 수 있습니다.

통합 전사 서비스

서드파티 트랜잭션 제품에 대한 의존도를 없애고 E2E 보안 및 규정 준수를 통해 데이터에 대한 보다 커진 제어 권한을 행사할 수 있습니다.

손쉬운 통합

OCI Speech는 REST API, 다양한 SDK 및 Oracle CLI를 통해 호출 가능한 만능 서비스입니다. 개발자는 데이터 과학 또는 머신러닝 전문 지식 없이도 확장 가능한 음성 서비스를 손쉽게 배포할 수 있죠.

보안 및 개인정보 보호를 위한 맞춤 설계

Oracle Cloud Infrastructure Speech는 고객 개인정보를 보호합니다. 사전 구축된 자동 음성 인식 모델이 콘텐츠를 전사하는 동안에도, 교육, 디버깅 또는 기타 목적으로 귀사의 데이터를 저장하는 일은 결코 없죠.

통합 전사 서비스

OCI Speech는 음성언어를 신속하게 텍스트로 변환할 수 있게 해주는 독점 모델 및 아키텍처를 사용합니다.

단어당 신뢰 점수

부정확하게 표기되었을 가능성이 있는 단어들을 손쉽게 알아차릴 수 있도록 단어 수준의 신뢰 점수를 추가했습니다. 애플리케이션 구축 시 중점을 두어야 할 요소들을 결정하는 데도 단어 신뢰 점수를 사용할 수 있습니다.

비속어 필터

선별된 비속어 목록을 사용하여 사전 구축 단어 필터링 기능을 추가했습니다. 비속어를 숨기거나, 삭제하거나, 태그를 지정할 수 있습니다.

OCI Speech 사용 사례

고객 반응 분석
디지털 미디어 콘텐츠 검색 및 폐쇄 자막

디지털 미디어 서비스를 통해 생성 및 엄선된 모든 콘텐츠에 대해 OCI 플랫폼에서 워크플로 내 자막을 자동으로 제공합니다. OCI 음성으로 콘텐츠를 인덱스화하여 전체 콘텐츠를 간편하게 검색할 수 있습니다.
콜 센터 통화 분석

OCI Speech는 고객과의 통화 내역을 전사하여 정보를 간편하게 탐색하거나 불러올 수 있게 해줍니다. OCI Language 및 이상 감지 기능을 함께 사용해 대화 속 감정을 감지하고 고객 이탈 가능성 및 직원 교육 기회를 파악할 수 있죠.

OCI Speech 리소스

설명서
- OCI Speech 설명서
- OCI Speech 참조 아키텍처
관련 제품
- OCI Language
  언어를 감지하고 구조화되지 않은 텍스트의 감정 분석을 제공하는 인공지능 및 머신러닝 기능입니다.
- OCI Anomaly Detection
  맞춤 훈련된 비즈니스별 이상 감지 모델을 애플리케이션에 통합합니다.
- Oracle Digital Assistant
  애플리케이션을 위한 대화형 인터페이스를 구축합니다.

2022년 4월 27일

이제 OCI Speech에서 구두점, 자막, 8kHz 모델을 사용할 수 있습니다.

Guy Michaeli, Senior Principal Product Manager

8kHz 오디오 파일의 네이티브 지원, SRT 출력 지원(자막 파일 포맷), 출력 텍스트에 자동 구두점 삽입이라는 Speech 서비스의 세 가지 새로운 기능을 기쁜 마음으로 소개합니다. 세 기능 모두 추가 비용 없이 무료로 제공됩니다. 해당 기능들은 모든 OCI의 상업 리전에서 바로 이용 가능합니다. 이는 고객을 위한 고품질의, 저렴한 전사 기능을 제공하기 위한 Oracle의 노력의 일환입니다.

전체 기사 읽기

OCI Speech 관련 블로그

2022년 3월 12일 Oracle Cloud Infrastructure(OCI) Speech GA 발표
2021년 11월 3일 앱에 자동 음성 인식 기능을 추가하는 간단한 방법

모두 보기

OCI 시작하기

Oracle Cloud Free Tier

Oracle Cloud에서는 애플리케이션 구축, 테스트, 배포를 무료로 체험할 수 있습니다.

Oracle Cloud Free Tier 체험하기

AI 음성 인식

사전 구축된 음향 및 언어 모델

오디오 및 비디오 파일의 데이터 분석

다국어 기본 지원

통합 전사 서비스

손쉬운 통합

보안 및 개인정보 보호를 위한 맞춤 설계

통합 전사 서비스

단어당 신뢰 점수

비속어 필터

OCI Speech 사용 사례

고객 반응 분석

디지털 미디어 콘텐츠 검색 및 폐쇄 자막

콜 센터 통화 분석

이제 OCI Speech에서 구두점, 자막, 8kHz 모델을 사용할 수 있습니다.

OCI Speech 관련 블로그

OCI 시작하기

Oracle Cloud Free Tier