اگر امروز برای اجرای عاملهای هوش مصنوعی را به APIهای ابری گرانقیمت پول میدهید، خبر خوب این است که هزینههای شما میتواند ۸۰۰ برابر کاهش یابد. OpenJarvis، چارچوب جدیدی از دانشگاه استنفورد و آزمایشگاههای Lambda، ثابت کرد که عاملهای محلی میتوانند با اختلافی کمتر از ۳.۲ درصد، کیفیتی برابر با برترین مدلهای ابری داشته باشند.
بسیاری از کاربران اکنون با عامل (Agent) — شبیه به دستیاری شخصی که فقط حرف نمیزند، بلکه میتواند واقعاً کد بنویسد یا بلیط بخرد — سر و کار دارند. اما اکثر این ابزارها هر پرسش را به سرورهای ابری میفرستند. طبق مقالهای که در ۱۶ مه ۲۰۲۶ منتشر شد، مدلهای محلی اکنون ۸۸.۷٪ از تکالیف استدلالی تکمرحلهای را مدیریت میکنند. همانطور که در تحلیلهای پیشین ما دربارهی گذار به مدلهای محلی اشاره کردیم، وابستگی به ابر دیگر یک ضرورت فنی نیست، بلکه یک انتخاب است. این روند بهینهسازی هزینهها پیش از این نیز در پروژههای مشابه دیده شده بود؛ برای مثال، پروژهی OpenHuman با استفاده از لایهی فشردهسازی TokenJuice توانست هزینههای مدلهای زبانی بزرگ را تا ۸۰ درصد کاهش دهد.
این سیستم، ساختار هوش مصنوعی را به پنج بخش قابل تعویض تقسیم کرده است: هوشمندی، موتور، عاملها، ابزارها و حافظه، و یادگیری. این بخشها از طریق یک فایل تنظیمات به نام spec مدیریت میشوند.
به نقل از مستندات پروژه، نتایج فنی این مدلها خیرهکننده است:
- مدل Qwen3.5-122B به دقت ۸۰.۳٪ رسید؛ یعنی تنها ۳.۲ درصد پایینتر از Claude Opus 4.6 (۸۳.۵٪).
- در ۴ مورد از ۸ بنچمارک، بهویژه در کدنویسی، مدلهای محلی از مدلهای ابری پیشی گرفتند.
- هزینه استنتاج (Inference) — لحظهای که مدل واقعاً جواب تولید میکند، شبیه خودِ آشپزی است نه یادگیری دستور پخت — از ۰.۰۰۹ دلار به ۱/۱۰۰۰ سنت کاهش یافت.
- تأخیر در اجرای کارهای پیچیده ۴ برابر کمتر شد. در همین راستا، مدل Holo3.1 از شرکت H موفق شد زمان اجرای گامهای عملیاتی این عاملها را تا ۵۰ درصد کاهش دهد تا بهرهوری عملیاتی را به حداکثر برساند.

تحلیلگران میگویند این اتفاق، بحث را از چتباتهای ساده به سمت عاملهای پیچیده میبرد. تیم توسعه از یک «معلم ابری» برای بهینهسازی «شاگرد محلی» استفاده کرده تا شکاف عملکرد را تا ۳۲ درصد پر کند. این یعنی توسعهکنندگان میتوانند بدون ترس از حریم خصوصی یا پرداخت هزینههای تکراری، به قدرت هوش مصنوعی زاینده (Generative AI) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — دست یابند.
گام بعدی شما
- چارچوب OpenJarvis را از طریق دستور نصب تکمرحلهای در GitHub روی macOS یا لینوکس اجرا کنید.
- کتابخانه ۱۳,۷۰۰ مهارتی در agentskills.io را برای متناسبسازی عاملهای خود بررسی کنید.
- اگر از مدلهای ابری استفاده میکنید، هزینه ماهانه خود را با نرخ ۱/۱۰۰۰ سنت مقایسه کنید.
bاید بدانید که سختافزارهای جدید این تحول را سریعتر میکنند؛ برای درک نقش تراشههای Blackwell در این مسیر، تحلیل ما را بخوانید.




گفتگو