Cactus Compute: مدل ۲۶ میلیون پارامتری Needle مدل‌های ۳۵۰ میلیونی را شکست داد

اگر در حال طراحی یک ساعت هوشمند یا عینک‌های واقعیت افزوده هستید، دیگر نیازی نیست برای اجرای دستورات ساده، سخت‌افزاری سنگین تهیه کنید. سد سخت‌افزاری برای استقرار عامل‌های هوشمند روی دستگاه‌ها به‌شدت پایین آمد.

صنعت اکنون به سمت «هوش مصنوعی کوچک» برای گجت‌های پوشیدنی حرکت می‌کند. در حالی که مدل‌های عظیم بر فضای ابری مسلط هستند، سخت‌افزارهای لبه برای حفظ باتری و حافظه به بهره‌وری مطلق نیاز دارند. همان‌طور که در تحلیل‌های قبلی ما درباره‌ی مدل‌های زبانی کوچک (SLM) اشاره کردیم، هدف این است که هوش مصنوعی بدون وابستگی به اینترنت، در لحظه پاسخ دهد.

در ۱۲ مه ۲۰۲۶، تیم Cactus Compute مدل Needle را منتشر کرد. این مدل یک «شبکه توجه ساده» با ۲۶ میلیون پارامتر است که از طریق تقطیر از Gemini 3.1 ساخته شده است. طبق اعلام این شرکت، مدل Needle روی سخت‌افزارهای Cactus به سرعت پیش‌خوانی ۶,۰۰۰ توکن بر ثانیه و سرعت رمزگشایی ۱,۲۰۰ توکن بر ثانیه می‌رسد.

به نقل از مستندات گیت‌هاب این پروژه، جزئیات فنی مدل به شرح زیر است:

پیش‌آموزش روی ۲۰۰ میلیارد توکن با استفاده از ۱۶ پردازنده TPU v6e در ۲۷ ساعت.
پس‌آموزش روی ۲ میلیارد توکن داده‌های فراخوانی ابزار در ۴۵ دقیقه.
عملکرد برتر نسبت به مدل‌های FunctionGemma-270m، Qwen-0.6B و Granite-350m در فراخوانی تک‌مرحله‌ای ابزارها.

این تحول ثابت می‌کند که تقطیر شدید می‌تواند مدل‌های «جراحی» بسازد. شما برای فعال کردن یک ابزار هواشناسی، به یک مدل همه‌کاره و فیلسوف نیاز ندارید؛ بلکه یک ماشه دقیق می‌خواهید. این نتیجه، این فرض را که رفتار عامل‌محور (Agentic) نیازمند صدها میلیون پارامتر است، به چالش می‌کشد.

برای استفاده از این مدل، باید از تنظیم دقیق (Fine-tuning) — که شبیه وقتی است که به یک پزشک عمومی، تخصص پوست می‌دهیم تا روی یک حوزه دقیق شود — استفاده کنید تا مدل روی ابزارهای خاص شما بهینه شود. در نهایت، استنتاج (Inference) — یعنی همان لحظه‌ی آشپزی و تولید جواب، نه دوره‌ی آموزش — در این مدل با سرعت خیره‌کننده‌ای رخ می‌دهد.

گام بعدی شما

مخزن گیت‌هاب پروژه را کلون کنید.
از رابط کاربری وب داخلی برای تنظیم دقیق Needle روی ابزارهای سفارشی خود استفاده کنید.
سرعت پاسخ‌دهی مدل را در محیط‌های محدود حافظه تست کنید.

اما تأثیر این مدل بر مصرف باتری گجت‌ها داستان دیگری دارد — به بررسی ما درباره‌ی بهینه‌سازی سخت‌افزاری مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

به نقل از مستندات گیت‌هاب این پروژه، جزئیات فنی مدل به شرح زیر است:

پیش‌آموزش روی ۲۰۰ میلیارد توکن با استفاده از ۱۶ پردازنده TPU v6e در ۲۷ ساعت.
پس‌آموزش روی ۲ میلیارد توکن داده‌های فراخوانی ابزار در ۴۵ دقیقه.
عملکرد برتر نسبت به مدل‌های FunctionGemma-270m، Qwen-0.6B و Granite-350m در فراخوانی تک‌مرحله‌ای ابزارها.

گام بعدی شما

مخزن گیت‌هاب پروژه را کلون کنید.
از رابط کاربری وب داخلی برای تنظیم دقیق Needle روی ابزارهای سفارشی خود استفاده کنید.
سرعت پاسخ‌دهی مدل را در محیط‌های محدود حافظه تست کنید.

Cactus Compute: مدل ۲۶ میلیون پارامتری Needle مدل‌های ۳۵۰ میلیونی را شکست داد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Cactus Compute: مدل ۲۶ میلیون پارامتری Needle مدل‌های ۳۵۰ میلیونی را شکست داد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Cactus Compute: مدل ۲۶ میلیون پارامتری Needle مدل‌های ۳۵۰ میلیونی را شکست داد

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Cactus Compute: مدل ۲۶ میلیون پارامتری Needle مدل‌های ۳۵۰ میلیونی را شکست داد

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران