الأسئلة الشائعة المتعلقة بتحويل الكلام إلى نص باستخدام الذكاء الاصطناعي

عام

ما المقصود بـ Oracle Cloud Infrastructure Speech؟

إن OCI Speech خدمة تستخدم التعرف التلقائي على الكلام (ASR) لتحويله إلى نص. تتيح هذه الخدمة للمطورين ووحدات الأعمال وموفري المحتوى والمتعاملين والمستخدمين الآخرين إمكانية نسخ ملفات الصوت. باستخدام OCI Speech، يمكن للمستخدمين نقل مكالمات أو اجتماعات مركز الاتصالات، وإنشاء تسميات توضيحية مغلقة، وفهرسة محتوى الصوت والفيديو والبحث فيه.

لماذا يجب عليّ استخدام OCI Speech؟

يجب عليك استخدام OCI Speech إذا كنت بحاجة إلى خدمة نسخ سريعة ودقيقة ومميزة بتوقيت. إذا كنت تستخدم OCI لتخزين الملفات الصوتية، فأنت تستمتع أيضًا بزمن انتقال أقل وبدون تكاليف شبكة مرتبطة بالنشر.

كيف يمكنني بدء استخدام OCI Speech؟

ابدأ من هنا لإنشاء التسجيل الأول، أو اقرأ المزيد حول الخدمة من هنا.

الميزات

ما خدمات النسخ التي تدعمها؟

ندعم حاليًا النسخ غير المتزامن القائم على الملفات. لا نوفر نسخًا في الوقت الفعلي في الوقت الحالي.

ما اللغات المدعومة حاليًا؟

يأتي النسخ مع نماذج تم تدريبها مُسبقًا للغات التالية: الإنجليزية والإسبانية والبرتغالية.

هل الملفات التي قمت بنسخها تستخدمها OCI لتحسين الخدمة (أو لأي شيء آخر)؟

لا، ننسخ فحسب المحتوى ولا نحتفظ بأي معلومات من الملف.

ماذا يجب أن أعرف عن الخدمة؟

مثل أي خدمة نسخ أخرى، تعتمد جودة المخرجات على جودة ملف الصوت المُدخل. يمكن أن تؤثر لهجات المتحدثين وضوضاء الخلفية والتبديل بين اللغات باستخدام لغات الاندماج (مثل إسباني-إنجليزي) والعديد من الأشخاص الذين يتحدثون في وقت واحد على جودة النسخ. نعمل باستمرار على تحسين أداء الخدمة لتوفير نسخ أدق لجميع المدخلات والمتحدثين.

هل يمكن لـ OCI Speech اكتشاف اللغة في الملف تلقائيًا؟

ليس حاليًا (لكن قريبًا).

ما تنسيقات ملفات المدخلات التي تدعمها؟

ندعم ملفات صوتية أحادية القناة و16 بت PCM WAV مع معدل عينة 16 كيلو هرتز. نوصي باستخدام Audacity (GUI) أو ffmpeg (سطر الأوامر) لتحويل ترميز الصوت. تتوفر تنسيقات صوتية إضافية قريبًا.

ما تنسيقات المخرجات التي تدعمها؟

ندعم JSON (كافتراضي) وSRT (كخيار بدون أي تكاليف إضافية).

الفواتير والتسعير

كيف يتم محاسبتي؟

نستخدم الفوترة الدقيقة مما يعني أننا نحملك 0.50 دولار لكل ساعة من النسخ، لكننا نستخدم الثواني لقياس الاستخدام المُجمع. على سبيل المثال، إذا قمت بتحميل ثلاثة ملفات بالمدد التالية: 3600 ثانية و4575 ثانية و1421 ثانية، فيتم احتساب فاتورتك الشهرية بواسطة مجموع الثواني (9596) مقسومًا على 3600 ثانية (عدد الثواني في الساعة)، مضروبًا في 0.50 دولار. بعبارة أخرى، سيتم دفع 1.332 دولار أو 9,596/3,600 دولار × 0.50 دولار = 1.332 دولار.

ما القياس القابل للفوترة لـ OCI Speech؟

قمنا بتسمية "ساعة الوصف" الخاصة بالقياس القابل للفوترة لدينا. تقيس ساعة النسخ عدد ساعات الصوت التي تم نسخها خلال شهر محدد من الخدمة.

هل هناك أي رسوم إعداد أو التزامات حد أدنى للخدمة مع Speech؟

لا، إن OCI Speech ليس له أي رسوم إعداد أو حد أدنى من التزامات الخدمة. ولا توجد أجهزة مطلوبة.

هل تقدم أي ساعات مجانية لتجربة الخدمة؟

نعم. نقدم 5 ساعات من التسجيل المجاني كل شهر لكل مستأجر.

هل تفرض رسومًا إضافية على الترقيم أم على SRT؟

إن الترقيم هو خدمة مجانية مثل SRT. قد يؤدي تخزين ملفات SRT إلى زيادة رسوم التخزين.

أسئلة تقنية أخرى

ما الأجهزة التي سيتم دعمها بواسطة OCI Speech؟

تعمل المحادثة مع أي جهاز تسجيل، ليست خاصة بجهاز.

الملف الخاص بي ليس ملف WAV. كيف يمكنني تحويل ملفي إلى WAV؟

نوصي باستخدام البرنامج المساعد ffmpeg مع الأمر التالي: ffmpeg -i <input.ext> -fflags +bitexact -acodec pcm_s16le -ac 1 -ar 16000 <output.wav>.

أتلقى رسالة الخطأ التالية: إما أن الحزمة المسماة "غير معرفة" غير موجودة في مساحة الاسم <namespace> أو أنك غير مصرح لك بالوصول إليها. كيف يمكنني إصلاح ذلك؟

راجع إعداد نظام المحادثة.