اگر امروز در حال ساخت عاملهای کدنویسی خودکار هستید، دیگر نیازی به گرانترین مدلهای دنیا ندارید. تصور کنید یک مدل ۳۰ میلیاردی بتواند کارهایی را انجام دهد که پیشتر فقط از مدلهای ۱۲۰ میلیاردی ساخته بود — آن هم سریعتر و ارزانتر.
به نقل از گزارش منتشرشده در ۹ ژوئن ۲۰۲۶، شرکت Cohere مدل North Mini Code را معرفی کرد. این مدل در شاخص کدنویسی Artificial Analysis، رقبایی را شکست داد که چهار برابر بزرگتر از آن بودند.

این مدل از معماری مخلوط خبرگان (MoE) — شبیه تیمی از متخصصان که فقط فرد مناسب برای هر سوال فراخوانده میشود — بهره میبرد. در حالی که مجموع پارامترها ۳۰ میلیارد است، در هر لحظه فقط ۳ میلیارد پارامتر فعال هستند. پنجره متنی این مدل نیز از ۶۴ هزار توکن به ۱۲۸ هزار توکن ارتقا یافته است.
بر اساس مستندات فنی، مسیر آموزش این مدل شامل دو مرحله تنظیم دقیق تحت نظارت (SFT) — شبیه یادگیری از روی نمونههای صحیح، مثل دانشآموزی که جوابها را از روی دفترچه میکشد — و سپس یادگیری تقویتشده با پاداشهای متقن (RLVR) بوده است. RLVR در واقع شبیه آزمونی است که جوابش با اجرای واقعی کد مشخص میشود، نه با نظر یک انسان.
نتایج کلیدی این مدل عبارتند از:
- کسب امتیاز ۳۳.۴ در شاخص Artificial Analysis و پیشی گرفتن از Nemotron 3 Super (۱۲۰ میلیاردی).
- نرخ موفقیت ۸۰.۲٪ در آزمون SWE-Bench Verified.
- نرخ موفقیت ۵۵.۱٪ در Terminal-Bench v2.


همانطور که در تحلیلهای پیشین ما دربارهی مدلهای زبانی کوچک (SLM) اشاره کردیم، دنیای هوش مصنوعی از تمرکز بر حجم مطلق به سمت بهینهسازی تخصصی حرکت میکند.

هدف Cohere ساخت ابزاری برای مهندسی نرمافزار عاملمحور (Agentic) است. در این حالت، مدل نباید فقط یک تابع بنویسد، بلکه باید بتواند با ترمینال کار کند، فایلها را ویرایش کند و باگهای پیچیده را در کل مخزن کد پیدا کند. برای رسیدن به این هدف، مدل روی رابطهای مختلفی مثل SWE-Agent و OpenCode آموزش دیده است.
به باور تحلیلگران Cohere، استفاده از پاداشهای متقن باعث شده تا «پرشهای بیمورد» و تکرار اشتباهات در فراخوانی ابزارها کاهش یابد. این یعنی برای توسعهدهندگان، استنتاج (Inference) — همان لحظهای که مدل واقعاً جواب تولید میکند، شبیه خودِ آشپزی است نه دورهی آموزش آن — ارزانتر و سریعتر شده است.


گام بعدی شما
- قابلیتهای مدل را در محیط OpenCode یا از طریق API شرکت Cohere آزمایش کنید.
- هزینه و سرعت استنتاج این مدل را با مدلهای بزرگتر مقایسه کنید تا نقطه بهینه برای پروژه خود بیابید.
- بررسی کنید که آیا RLVR میتواند نرخ خطای ابزارهای کدنویسی شما را کاهش دهد یا خیر.
اما این تنها بخشی از ماجراست؛ رقابت مدلهای وزنباز برای رسیدن به این سطح از کارایی را در گزارش بعدی بررسی خواهیم کرد.



گفتگو