اگر مدیر یک تیم بینالمللی هستید یا برای کار سفر میکنید، سد زبانی همین حالا کوچکتر شد. گوگل در ۹ ژوئن ۲۰۲۶ قابلیت ترجمه همزمان صوتی را برای بیش از ۷۰ زبان در Gemini 3.5 Live Translate فعال کرد.
این ابزار در زمانی میرسد که شرکتها با دقت هوش مصنوعی زاینده (Generative AI) دستوپنجه نرم میکنند. مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — اکنون باید کاربردیتر شود. همانطور که در تحلیل قبلی ما دربارهی حکم دادگاه مونیخ در مورد خطاهای جستجوی گوگل اشاره کردیم، این غول فناوری حالا روی ابزارهای کاربردی تمرکز کرده است. گوگل ترجیح میدهد بهجای نمایش خلاقیت، روی دقت و تحویل انسانی متمرکز شود.
به گزارش the-decoder.com، این مدل زبانها را بهطور خودکار تشخیص میدهد. ترجمه بهصورت مستمر انجام میشود و مدل منتظر پایان جمله نمیماند. همچنین، هوش مصنوعی لحن، سرعت و زیروبمی صدای گوینده را حفظ میکند.
جزئیات استقرار این فناوری به شرح زیر است:
- دسترسی: همین حالا در اپلیکیشن Google Translate برای iOS و اندروید فعال است. توسعهدهندگان میتوانند از طریق Gemini Live API و Google AI Studio به آن دسترسی پیدا کنند.
- Google Meet: تعداد زبانهای پشتیبانیشده از ۵ مورد به بیش از ۷۰ زبان رسید که بیش از ۲ هزار ترکیب زبانی مختلف را میسازد.
- تست میدانی: سرویس تاکسیرانی Grab در حال آزمایش این مدل برای ارتباط رانندگان و مسافران است.
- امنیت: هر کلیپ صوتی شامل یک واترمارک نامرئی به نام SynthID است.
برای یک مسافر تجاری، این یعنی پایان تأخیرهای آزاردهنده در اپلیکیشنهای ترجمه قدیمی. این فناوری تماسهای استاندارد Google Meet را به یک مرکز جهانی تبدیل میکند. آزمایش شرکت Grab نشان میدهد که حل ارتباطات «آخرین کیلومتر» در اقتصاد گیگی، برنده بزرگ بعدی برای مدلهای زبانی است.
گام بعدی شما
- تست قابلیتهای جدید در اپلیکیشن Google Translate برای سفرهای کاری.
- بررسی مستندات Gemini Live API جهت ادغام در محصولات ارتباطی B2B.
- رصد پذیرش این فناوری در سایر پلتفرمهای لجستیکی.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.



گفتگو