تصور کنید تنها ۱۲۰ ثانیه زمان لازم باشد تا صدای شما را بهطور کامل کپی کنند. اگر هنوز تصور میکنید شبیهسازی صدای باکیفیت نیازمند ساعتها ضبط در استودیو است، باید بدانید که قواعد بازی تغییر کرده است.
طبق گزارش the-decoder.com، شرکت xAI در تاریخ ۲ مه ۲۰۲۶ ابزاری به نام Custom Voices را عرضه کرد. این سیستم میتواند یک نمونهی ۶۰ ثانیهای از گفتار طبیعی را در کمتر از ۲ دقیقه به یک کلون صوتی کاربردی تبدیل کند. این سرعت خیرهکننده به توسعهدهندگان اجازه میدهد تا رابطهای صوتی بهشدت شخصیسازیشده را تقریباً بهصورت آنی مستقر کنند.
این قابلیت مستقیماً با APIهای تبدیل متن به گفتار (TTS) و عامل (Agent) صوتی این شرکت ادغام شده است. برای مقابله با تهدید جعل عمیق (Deepfake)، xAI یک فرآیند تأیید دو مرحلهای را پیاده کرده است:
- کاربر ابتدا باید یک عبارت عبور (Passphrase) را بخواند که سیستم در لحظه آن را بررسی میکند.
- سپس، سیستم ویژگیهای صوتی هر دو ضبط را با هم مقایسه میکند تا اطمینان حاصل شود که شخص یکسانی در حال صحبت است.
به نقل از xAI، این سازوکار شبیهسازی صدا از روی ضبطهای قدیمی یا جعل صدای دیگران را غیرممکن میکند. همچنین، کنسول این شرکت اکنون شامل یک «کتابخانه صوتی» با بیش از ۸۰ صدای پیشفرض در ۲۸ زبان مختلف است و نکتهی کلیدی این است که استفاده از این صداهای کلونشده هزینه اضافی برای کاربر ندارد.
همانطور که در تحلیل قبلی ما دربارهی استراتژی تهاجمی xAI برای تسخیر بازار اشاره کردیم، این شرکت بهسرعت در حال گسترش اکوسیستم خود است. این قابلیت جدید بر پایه مدل Grok Voice Think Fast 1.0 بنا شده است؛ مدل چندوجهی (Multimodal) خاصی که در حال حاضر عملیات پشتیبانی مشتری و فروش Starlink را مدیریت میکند.
این یعنی توسعهدهندگان دیگر نیازی به استخدام صداپیشگان حرفهای یا اجاره استودیوهای گرانقیمت ندارند و میتوانند تجربههای شنیداری سفارشی را برای هر کاربر خلق کنند. این تحول، سنتز صدای باfidelity بالا را برای توسعهدهندگان کوچک و سازمانهای بزرگ دموکراتیزه میکند.
اما این تنها بخشی از پازل است؛ اثر این فناوری بر امنیت بیومتریک و سیستمهای احراز هویت صوتی را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر توسعهدهنده هستید، مستندات APIهای صوتی Grok را برای پیادهسازی دستیارهای شخصی بررسی کنید.
- استراتژیهای امنیتی خود را در برابر حملات صوتی مبتنی بر هوش مصنوعی زاینده (Generative AI) بازنگری کنید.
- کتابخانه صوتی xAI را برای یافتن بهینترین لحن برند خود در زبانهای مختلف تست کنید.




گفتگو