عبور از تضاد تخصص محلی و هوش عمومی در مدل ۱۲۳ میلیارد پارامتری Phoenix-VL 1.5

باید بپذیریم که دوران مدل‌های حاکمیتی کوچک و محدود به پایان رسیده است. تصور کنید مدلی داشته باشید که هم در پیچیده‌ترین مسائل حقوقی یک کشور تخصص داشته باشد و هم در سطح جهانی با برترین مدل‌های STEM رقابت کند؛ Phoenix-VL 1.5 دقیقاً همین ادعا را به کرسی نشاند.

در حالی که ملت‌ها برای دستیابی به استقلال دیجیتال می‌جنگند، چالش اصلی همواره ایجاد تعادل بین ظرافت‌های محلی و استدلال عمومی بوده است. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی مدل‌های وزن‌باز (Open Weights) اشاره کردیم، تخصص محلی معمولاً به قیمت کاهش توانایی‌های کلی مدل تمام می‌شد. اما گزارش فنی منتشر شده در ۱۲ می ۲۰۲۶، نقشه‌ای جدید برای تخصصی‌سازی منطقه‌ای ارائه می‌دهد.

این مدل که توسط Team Phoenix و Mistral AI توسعه یافته و بر پایه Mistral Medium 3.1 بنا شده است، طبق مستندات arXiv از یک خط لوله آموزشی چهارمرحله‌ای عبور کرده است:

پیش‌آموزش مستمر روی یک مجموعه داده چندوجهی (Multimodal) بومی‌سازی شده با ۱ تریلیون توکن.
فاز گسترش پنجره متنی با ۲۵۰ میلیارد توکن برای مدیریت داده‌های طولانی.
پس‌آموزش روی ۲۲ میلیارد توکن از داده‌های چندوجهی و قوانین سنگاپور که توسط انسان برچسب‌گذاری شده‌اند.
همراستاسازی (Alignment) با ۵ میلیارد توکن از طریق بهینه‌سازی مستقیم ترجیحات آنلاین (Online DPO).

این رویکرد، این فرض رایج در صنعت را که مدل‌های منطقه‌ای باید لزوماً کوچک باشند یا به قیمت از دست دادن کاربرد عمومی، تخصصی شوند، به چالش می‌کشد. توسعه‌دهندگان با استفاده از معماری ۱۲۳ میلیارد پارامتری ثابت کردند که «تطبیق عمیق دامنه» می‌تواند در کنار عملکرد سطح بالای STEM و چندزبانی هم‌زیستی کند.

به باور تحلیلگران، این مدل اکنون به عنوان یک متخصص محلی و یک رقیب جهانی عمل می‌کند و مرز بین مدل‌های عمومی و تخصصی را می‌شکند.

گام بعدی شما

بررسی گزارش فنی arXiv برای درک دقیق‌تر توزیع توکن‌ها در فاز پس‌آموزش.
رصد واکنش‌های سایر کشورهای G20 برای مشاهده تکرار این دستور پخت آموزشی در سایر حوزه‌های حاکمیتی.
تست مدل‌های مشابه برای سنجش میزان افت توانایی STEM در مقابل افزایش تخصص محلی.

اما تأمین سخت‌افزاری برای استقرار چنین مدل‌های حجیمی چالش بعدی است؛ تحلیل ما درباره‌ی زیرساخت‌های محاسباتی و تراشه‌های Blackwell را بخوانید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

پیش‌آموزش مستمر روی یک مجموعه داده چندوجهی (Multimodal) بومی‌سازی شده با ۱ تریلیون توکن.
فاز گسترش پنجره متنی با ۲۵۰ میلیارد توکن برای مدیریت داده‌های طولانی.
پس‌آموزش روی ۲۲ میلیارد توکن از داده‌های چندوجهی و قوانین سنگاپور که توسط انسان برچسب‌گذاری شده‌اند.
همراستاسازی (Alignment) با ۵ میلیارد توکن از طریق بهینه‌سازی مستقیم ترجیحات آنلاین (Online DPO).

گام بعدی شما

بررسی گزارش فنی arXiv برای درک دقیق‌تر توزیع توکن‌ها در فاز پس‌آموزش.
رصد واکنش‌های سایر کشورهای G20 برای مشاهده تکرار این دستور پخت آموزشی در سایر حوزه‌های حاکمیتی.
تست مدل‌های مشابه برای سنجش میزان افت توانایی STEM در مقابل افزایش تخصص محلی.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

عبور از تضاد تخصص محلی و هوش عمومی در مدل ۱۲۳ میلیارد پارامتری Phoenix-VL 1.5

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

عبور از تضاد تخصص محلی و هوش عمومی در مدل ۱۲۳ میلیارد پارامتری Phoenix-VL 1.5

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

عبور از تضاد تخصص محلی و هوش عمومی در مدل ۱۲۳ میلیارد پارامتری Phoenix-VL 1.5

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

عبور از تضاد تخصص محلی و هوش عمومی در مدل ۱۲۳ میلیارد پارامتری Phoenix-VL 1.5

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران