باید بدانید که تعداد پارامترها دیگر تنها معیار تعیینکنندهی دقت در سیستمهای چندوجهی نیست. تصور کنید بتوانید با استفاده از یک مدل کوچک، عملکردی را به دست آورید که پیشتر نیازمند مدلهایی با ابعادی صدها برابر بزرگتر بود.
در حال حاضر توسعهدهندگان هنگام انتخاب میان مدلهای متنوع مدل چندوجهی (Vision-Language Model - VLM) با چالشهای جدی در توازن میان هزینه و کیفیت مواجهاند. این ناکارآمدی در واقع بازتابی از «پارادوکس عملکرد» است که پیشتر در مدلهای زبانی مشاهده شد؛ جایی که بزرگترین مدل لزوماً بهینهترین گزینه برای یک وظیفهی خاص نیست. همانطور که در تحلیلهای پیشین ما دربارهی قوانین مقیاسپذیری اشاره کردیم، تمرکز صنعت از «بزرگتر کردن مدل» به سمت «بهینهسازی کاربرد» در حال تغییر است.
طبق گزارشی که در ۹ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، پژوهشگران مسیریابی ARMS را با استفاده از یک مجموعهدادهی چندوجهی تخصصی توسعه دادهاند که شامل خروجیهای ۷ مدل VLM جریان اصلی برای ۳۲،۶۲۶ پرسوجوی منحصربهفرد است. ساختار فنی این سیستم عبارت است از:
- یک معماری مسیریابی که پروفایلهای VLM را برای بهبود نمایش قابلیتها و پرسوجوها یکپارچه میکند.
- دو استراتژی آموزش توسعهای: «آموزش افزایشی» و «آموزش مستقل» که اجازه میدهد مسیریاب بدون نیاز به بازآموزی کامل و هزینهبر، با مدلهای VLM جدید تطبیق یابد.
- مقیاس ۸۰۰ میلیون پارامتر که استنتاج (Inference) را به حداقل میرساند اما دقت انتخاب مدل را در سطح بال نگه میدارد.
این دستاورد، این فرض را که تعداد پارامترها تنها راه رسیدن به دقت است، به چالش میکشد. با انتقال تمرکز فنی از «اندازهی مدل» به «کارایی هماهنگکننده»، صنعت به سمت «تجمعات مدل» حرکت میکند؛ جایی که یک مسیریاب سبکوزن، ناوگانی از مدلهای زبانی کوچک (Small Language Models - SLM) تخصصی را مدیریت میکند تا هزینههای عملیاتی بدون افت کیفیت، بهشدت کاهش یابد.
گام بعدی شما
- پایش مخزن (Repository) ناشناس این پروژه برای دسترسی به کدها و مجموعهدادههای منتشرشده.
- بررسی امکان پیادهسازی ساختار مسیریابی ARMS در خطلولههای (Pipelines) چندوجهی فعلی برای کاهش هزینه.
- تحلیل اثر جایگزینی مدلهای monolithic با تجمعات مدل در زیرساختهای استقرار.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چگونه این مدلهای کوچک بر روی سختافزارهای لبه اجرا میشوند، به تحلیل ما دربارهی رایانش لبه مراجعه کنید.
گفتگو