چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

اگر امروز برای اجرای عامل‌های هوش مصنوعی را به APIهای ابری گران‌قیمت پول می‌دهید، خبر خوب این است که هزینه‌های شما می‌تواند ۸۰۰ برابر کاهش یابد. OpenJarvis، چارچوب جدیدی از دانشگاه استنفورد و آزمایشگاه‌های Lambda، ثابت کرد که عامل‌های محلی می‌توانند با اختلافی کمتر از ۳.۲ درصد، کیفیتی برابر با برترین مدل‌های ابری داشته باشند.

بسیاری از کاربران اکنون با عامل (Agent) — شبیه به دستیاری شخصی که فقط حرف نمی‌زند، بلکه می‌تواند واقعاً کد بنویسد یا بلیط بخرد — سر و کار دارند. اما اکثر این ابزارها هر پرسش را به سرورهای ابری می‌فرستند. طبق مقاله‌ای که در ۱۶ مه ۲۰۲۶ منتشر شد، مدل‌های محلی اکنون ۸۸.۷٪ از تکالیف استدلالی تک‌مرحله‌ای را مدیریت می‌کنند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی گذار به مدل‌های محلی اشاره کردیم، وابستگی به ابر دیگر یک ضرورت فنی نیست، بلکه یک انتخاب است. این روند بهینه‌سازی هزینه‌ها پیش از این نیز در پروژه‌های مشابه دیده شده بود؛ برای مثال، پروژه‌ی OpenHuman با استفاده از لایه‌ی فشرده‌سازی TokenJuice توانست هزینه‌های مدل‌های زبانی بزرگ را تا ۸۰ درصد کاهش دهد.

این سیستم، ساختار هوش مصنوعی را به پنج بخش قابل تعویض تقسیم کرده است: هوشمندی، موتور، عامل‌ها، ابزارها و حافظه، و یادگیری. این بخش‌ها از طریق یک فایل تنظیمات به نام spec مدیریت می‌شوند.

به نقل از مستندات پروژه، نتایج فنی این مدل‌ها خیره‌کننده است:

مدل Qwen3.5-122B به دقت ۸۰.۳٪ رسید؛ یعنی تنها ۳.۲ درصد پایین‌تر از Claude Opus 4.6 (۸۳.۵٪).
در ۴ مورد از ۸ بنچمارک، به‌ویژه در کدنویسی، مدل‌های محلی از مدل‌های ابری پیشی گرفتند.
هزینه استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند، شبیه خودِ آشپزی است نه یادگیری دستور پخت — از ۰.۰۰۹ دلار به ۱/۱۰۰۰ سنت کاهش یافت.
تأخیر در اجرای کارهای پیچیده ۴ برابر کمتر شد. در همین راستا، مدل Holo3.1 از شرکت H موفق شد زمان اجرای گام‌های عملیاتی این عامل‌ها را تا ۵۰ درصد کاهش دهد تا بهره‌وری عملیاتی را به حداکثر برساند.

چارچوب محلی OpenJarvis برای عامل‌های هوش مصنوعی شخصی با ابزار، حافظه و یادگیری

تحلیلگران می‌گویند این اتفاق، بحث را از چت‌بات‌های ساده به سمت عامل‌های پیچیده می‌برد. تیم توسعه از یک «معلم ابری» برای بهینه‌سازی «شاگرد محلی» استفاده کرده تا شکاف عملکرد را تا ۳۲ درصد پر کند. این یعنی توسعه‌کنندگان می‌توانند بدون ترس از حریم خصوصی یا پرداخت هزینه‌های تکراری، به قدرت هوش مصنوعی زاینده (Generative AI) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — دست یابند.

گام بعدی شما

چارچوب OpenJarvis را از طریق دستور نصب تک‌مرحله‌ای در GitHub روی macOS یا لینوکس اجرا کنید.
کتابخانه ۱۳,۷۰۰ مهارتی در agentskills.io را برای متناسب‌سازی عامل‌های خود بررسی کنید.
اگر از مدل‌های ابری استفاده می‌کنید، هزینه ماهانه خود را با نرخ ۱/۱۰۰۰ سنت مقایسه کنید.

bاید بدانید که سخت‌افزارهای جدید این تحول را سریع‌تر می‌کنند؛ برای درک نقش تراشه‌های Blackwell در این مسیر، تحلیل ما را بخوانید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

به نقل از مستندات پروژه، نتایج فنی این مدل‌ها خیره‌کننده است:

مدل Qwen3.5-122B به دقت ۸۰.۳٪ رسید؛ یعنی تنها ۳.۲ درصد پایین‌تر از Claude Opus 4.6 (۸۳.۵٪).
در ۴ مورد از ۸ بنچمارک، به‌ویژه در کدنویسی، مدل‌های محلی از مدل‌های ابری پیشی گرفتند.
هزینه استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند، شبیه خودِ آشپزی است نه یادگیری دستور پخت — از ۰.۰۰۹ دلار به ۱/۱۰۰۰ سنت کاهش یافت.
تأخیر در اجرای کارهای پیچیده ۴ برابر کمتر شد. در همین راستا، مدل Holo3.1 از شرکت H موفق شد زمان اجرای گام‌های عملیاتی این عامل‌ها را تا ۵۰ درصد کاهش دهد تا بهره‌وری عملیاتی را به حداکثر برساند.

چارچوب محلی OpenJarvis برای عامل‌های هوش مصنوعی شخصی با ابزار، حافظه و یادگیری

گام بعدی شما

چارچوب OpenJarvis را از طریق دستور نصب تک‌مرحله‌ای در GitHub روی macOS یا لینوکس اجرا کنید.
کتابخانه ۱۳,۷۰۰ مهارتی در agentskills.io را برای متناسب‌سازی عامل‌های خود بررسی کنید.
اگر از مدل‌های ابری استفاده می‌کنید، هزینه ماهانه خود را با نرخ ۱/۱۰۰۰ سنت مقایسه کنید.

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران