الترجمة الصوتية الطبيعية والسلسة مع Gemini 3.5 Live Translate
ترجمة صوتية طبيعية وسلسة مع Gemini 3.5 Live Translate
بدءنا قبل عشرين عامًا في جوجل تجربة رائدة في التعلم الآلي لتحويل علم اللغة إلى ارتباط بشري سحري، وهي الترجمة في جوجل. وقد قطعت هذه التجربة شوطًا بعيدًا مع ترجمة أكثر من تريليون كلمة لمليارات المستخدمين عبر منتجاتنا كل شهر.
نقوم اليوم بخطوة أخرى نحو الأمام مع إطلاق Gemini 3.5 Live Translate، وهو أحدث نموذج صوتي لترجمة الكلام الحية. يمكن للنموذج تحديد أكثر من 70 لغة تلقائيًا وإنشاء ترجمة متدفق وصوت طبيعي يحافظ على نغمة المتكلم وخطابه وموسيقاه.
على عكس الأنظمة التي تنتظر انتهاء المتكلم من الحديث قبل الاستجابة، يقوم نظام Gemini 3.5 Live Translate ب الصوت بشكل مستمر، مما يعادل بين الانتظار للحصول على السياق لتحسين الجودة و فورية البقاء متزامنة مع المتكلم.
سيبدأ طرح Gemini 3.5 Live Translate اليوم عبر منتجات جوجل، حيث سي becomesمتاح للمطورين عن طريق المعاينة العامة لـ Gemini Live API و Google AI Studio.
كما سيتم طرحه لرواد الأعمال في المعاينة الخاصة بدايةً من هذا الشهر في Google Meet ولجميع المستخدمين عبر تطبيقة جوجل على الأندرويد وios.
إنشاء التطبيقات مع 3.5 Live Translate
يعالج نموذج Gemini 3.5 Live Translate الكلام أثناء بثه، مما يتيح اتصالاً أكثر سلاسة عبر اللغات. يمكن للنموذج التعامل مع المدخلات متعددة اللغات دون الحاجة إلى ضبط الإعدادات يدوياً، وفي نفس الوقت، فإن قوته للتسامح مع الضوضاء تضمن أن التطبيقات يمكنها التعامل مع البيئات الصاخبة وغير القابلة للتنبؤ.
يمكنكم استخدام قدراته لتقديم التفسير الحي للمكالمات والاجتماعات والدروس والبث وغير ذلك.
يمكن مشاهدة مفعول Gemini Live API وتعرف على المزيد من أمثلة الشفرة في كتاب طبخ Gemini.
بالاستفادة من Gemini Live API، تسمح منصات المطورين مثل Agora و Fishjam و LiveKit و Pipecat وVision Agents للمطورين ببناء وتوزيع تطبيقات الترجمة الصوتية بسهولة.
تتولى هذه التكامُل بنية البث الإعلامي في الوقت الفعلي المعقدة، حتى يتمكن المطورون من التركيز على تجربة المستخدم.
يشترك شركاؤنا في Grab حاليًا في اختبار Gemini 3.5 Live Translate لتوفير تجارب ترجمة أفضل لعملائهم.
فريق التحرير
مساهم في اختيار المواد وترجمتها وتحريرها للقارئ العربي.