باید بپذیریم که دوران مدلهای حاکمیتی کوچک و محدود به پایان رسیده است. تصور کنید مدلی داشته باشید که هم در پیچیدهترین مسائل حقوقی یک کشور تخصص داشته باشد و هم در سطح جهانی با برترین مدلهای STEM رقابت کند؛ Phoenix-VL 1.5 دقیقاً همین ادعا را به کرسی نشاند.
در حالی که ملتها برای دستیابی به استقلال دیجیتال میجنگند، چالش اصلی همواره ایجاد تعادل بین ظرافتهای محلی و استدلال عمومی بوده است. همانطور که در تحلیلهای پیشین ما دربارهی مدلهای وزنباز (Open Weights) اشاره کردیم، تخصص محلی معمولاً به قیمت کاهش تواناییهای کلی مدل تمام میشد. اما گزارش فنی منتشر شده در ۱۲ می ۲۰۲۶، نقشهای جدید برای تخصصیسازی منطقهای ارائه میدهد.
این مدل که توسط Team Phoenix و Mistral AI توسعه یافته و بر پایه Mistral Medium 3.1 بنا شده است، طبق مستندات arXiv از یک خط لوله آموزشی چهارمرحلهای عبور کرده است:
- پیشآموزش مستمر روی یک مجموعه داده چندوجهی (Multimodal) بومیسازی شده با ۱ تریلیون توکن.
- فاز گسترش پنجره متنی با ۲۵۰ میلیارد توکن برای مدیریت دادههای طولانی.
- پسآموزش روی ۲۲ میلیارد توکن از دادههای چندوجهی و قوانین سنگاپور که توسط انسان برچسبگذاری شدهاند.
- همراستاسازی (Alignment) با ۵ میلیارد توکن از طریق بهینهسازی مستقیم ترجیحات آنلاین (Online DPO).
این رویکرد، این فرض رایج در صنعت را که مدلهای منطقهای باید لزوماً کوچک باشند یا به قیمت از دست دادن کاربرد عمومی، تخصصی شوند، به چالش میکشد. توسعهدهندگان با استفاده از معماری ۱۲۳ میلیارد پارامتری ثابت کردند که «تطبیق عمیق دامنه» میتواند در کنار عملکرد سطح بالای STEM و چندزبانی همزیستی کند.
به باور تحلیلگران، این مدل اکنون به عنوان یک متخصص محلی و یک رقیب جهانی عمل میکند و مرز بین مدلهای عمومی و تخصصی را میشکند.
گام بعدی شما
- بررسی گزارش فنی arXiv برای درک دقیقتر توزیع توکنها در فاز پسآموزش.
- رصد واکنشهای سایر کشورهای G20 برای مشاهده تکرار این دستور پخت آموزشی در سایر حوزههای حاکمیتی.
- تست مدلهای مشابه برای سنجش میزان افت توانایی STEM در مقابل افزایش تخصص محلی.
اما تأمین سختافزاری برای استقرار چنین مدلهای حجیمی چالش بعدی است؛ تحلیل ما دربارهی زیرساختهای محاسباتی و تراشههای Blackwell را بخوانید.




گفتگو