GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

·۱۴ خرداد ۱۴۰۵۸ دقیقه مطالعه
معرفی OpenJarvis: چارچوب محلی برای عامل‌های هوش مصنوعی شخصی با ابزار، حافظه و یادگیری
معرفی OpenJarvis: چارچوب محلی برای عامل‌های هوش مصنوعی شخصی با ابزار، حافظه و یادگیری
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

دستیابی به دقت ۳.۲ درصدی نسبت به مدل‌های ابری در یک سیستم «عامل‌محور» محلی، یک جهش است؛ پیش از این، مدل‌های محلی فقط در چت‌های ساده موفق بودند، اما اکنون در زنجیره‌ای از کارهای پیچیده با رقبای ابری رقابت می‌کنند.

اگر امروز برای اجرای عامل‌های هوش مصنوعی را به APIهای ابری گران‌قیمت پول می‌دهید، خبر خوب این است که هزینه‌های شما می‌تواند ۸۰۰ برابر کاهش یابد. OpenJarvis، چارچوب جدیدی از دانشگاه استنفورد و آزمایشگاه‌های Lambda، ثابت کرد که عامل‌های محلی می‌توانند با اختلافی کمتر از ۳.۲ درصد، کیفیتی برابر با برترین مدل‌های ابری داشته باشند.

بسیاری از کاربران اکنون با عامل (Agent) — شبیه به دستیاری شخصی که فقط حرف نمی‌زند، بلکه می‌تواند واقعاً کد بنویسد یا بلیط بخرد — سر و کار دارند. اما اکثر این ابزارها هر پرسش را به سرورهای ابری می‌فرستند. طبق مقاله‌ای که در ۱۶ مه ۲۰۲۶ منتشر شد، مدل‌های محلی اکنون ۸۸.۷٪ از تکالیف استدلالی تک‌مرحله‌ای را مدیریت می‌کنند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی گذار به مدل‌های محلی اشاره کردیم، وابستگی به ابر دیگر یک ضرورت فنی نیست، بلکه یک انتخاب است. این روند بهینه‌سازی هزینه‌ها پیش از این نیز در پروژه‌های مشابه دیده شده بود؛ برای مثال، پروژه‌ی OpenHuman با استفاده از لایه‌ی فشرده‌سازی TokenJuice توانست هزینه‌های مدل‌های زبانی بزرگ را تا ۸۰ درصد کاهش دهد.

این سیستم، ساختار هوش مصنوعی را به پنج بخش قابل تعویض تقسیم کرده است: هوشمندی، موتور، عامل‌ها، ابزارها و حافظه، و یادگیری. این بخش‌ها از طریق یک فایل تنظیمات به نام spec مدیریت می‌شوند.

به نقل از مستندات پروژه، نتایج فنی این مدل‌ها خیره‌کننده است:

  • مدل Qwen3.5-122B به دقت ۸۰.۳٪ رسید؛ یعنی تنها ۳.۲ درصد پایین‌تر از Claude Opus 4.6 (۸۳.۵٪).
  • در ۴ مورد از ۸ بنچمارک، به‌ویژه در کدنویسی، مدل‌های محلی از مدل‌های ابری پیشی گرفتند.
  • هزینه استنتاج (Inference) — لحظه‌ای که مدل واقعاً جواب تولید می‌کند، شبیه خودِ آشپزی است نه یادگیری دستور پخت — از ۰.۰۰۹ دلار به ۱/۱۰۰۰ سنت کاهش یافت.
  • تأخیر در اجرای کارهای پیچیده ۴ برابر کمتر شد. در همین راستا، مدل Holo3.1 از شرکت H موفق شد زمان اجرای گام‌های عملیاتی این عامل‌ها را تا ۵۰ درصد کاهش دهد تا بهره‌وری عملیاتی را به حداکثر برساند.

چارچوب محلی OpenJarvis برای عامل‌های هوش مصنوعی شخصی با ابزار، حافظه و یادگیری

تحلیلگران می‌گویند این اتفاق، بحث را از چت‌بات‌های ساده به سمت عامل‌های پیچیده می‌برد. تیم توسعه از یک «معلم ابری» برای بهینه‌سازی «شاگرد محلی» استفاده کرده تا شکاف عملکرد را تا ۳۲ درصد پر کند. این یعنی توسعه‌کنندگان می‌توانند بدون ترس از حریم خصوصی یا پرداخت هزینه‌های تکراری، به قدرت هوش مصنوعی زاینده (Generative AI) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — دست یابند.

گام بعدی شما

  • چارچوب OpenJarvis را از طریق دستور نصب تک‌مرحله‌ای در GitHub روی macOS یا لینوکس اجرا کنید.
  • کتابخانه ۱۳,۷۰۰ مهارتی در agentskills.io را برای متناسب‌سازی عامل‌های خود بررسی کنید.
  • اگر از مدل‌های ابری استفاده می‌کنید، هزینه ماهانه خود را با نرخ ۱/۱۰۰۰ سنت مقایسه کنید.

bاید بدانید که سخت‌افزارهای جدید این تحول را سریع‌تر می‌کنند؛ برای درک نقش تراشه‌های Blackwell در این مسیر، تحلیل ما را بخوانید.

چرا این موضوع مهم است؟

این دستاورد با تکیه بر اعتبار پژوهشی استنفورد، وابستگی استراتژیک توسعه‌دهندگان به APIهای گران‌قیمت را از بین می‌برد. انتقال قدرت از ابر به دستگاه (On-device)، امنیت داده‌ها را تضمین کرده و سد هزینه‌ای را برای استارت-آپ‌ها می‌شکند.

تأثیر برای ایران

این خبر برای توسعه‌دهندگان ایرانی حیاتی است؛ چرا که اجرای محلی مدل‌ها، مشکل تحریم‌ها و مسدود شدن APIهای خارجی را به‌طور کامل حل می‌کند و دسترسی به عامل‌های سطح بالا را بدون نیاز به پرداخت‌های ارزی فراهم می‌سازد.

·نگاه ما
تحریریه دات‌هوش

نگاه ما این است که OpenJarvis صرفاً یک ابزار رایگان نیست، بلکه پارادایم «عامل‌محوری» را از دیتاسنترها به لبه‌ی شبکه منتقل می‌کند. با استفاده از استراتژی معلم-شاگرد، استنفورد ثابت کرد که می‌توان مدل‌های کوچک را به گونه‌ای «تیون» کرد که عملکرد مدل‌های غول‌پیکر را شبیه‌سازی کنند. این یعنی آینده‌ی هوش مصنوعی، توزیع‌شده و خصوصی خواهد بود، نه متمرکز در چند شرکت آمریکایی.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه