اگر قصد دارید هوش مصنوعی را روی پردازندههای معمولی یا دستگاههای لبه مستقر کنید، دیگر نیازی به GPUهای عظیم برای اجرای کارهای استدلالی پیچیده ندارید. طبق یک مقاله پژوهشی که در ۱۹ ژوئن ۲۰۲۶ در AIS2C2 ۲۰۲۵ منتشر شد، یک چارچوب مبتنی بر پرامپت اکنون میتواند مدلهای زبانی کوچک و بازمتن را به عاملهای (Agent) هوشمند تبدیل کند.
این تحول در زمانی رخ میدهد که کاربران با هزینههای بالای مدلهای تجاری مثل GPT-4 دستوپنجه نرم میکنند. مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — در این روش دیگر قرار نیست همه چیز را حفظ باشد. همانطور که در تحلیل قبلی ما دربارهی نحوه ذخیرهسازی دادههای انسانی در وزنهای مدل اشاره کردیم، این رویکرد جدید هوشمندی را از وزنهای داخلی مدل به طراحی سیستم منتقل میکند.
بر اساس مستندات این پژوهش، این چارچوب بر سه قابلیت کلیدی برای مدلهای زبانی کوچک (SLM) تمرکز دارد:
- درک قصد: شکستن مسائل پیچیده به گامهای عملیاتی.
- انتخاب ابزار: تصمیمگیری برای استفاده از ماشینحساب، موتور جستوجو یا APIهای خارجی. این چالش انتخاب ابزار، نقطهی ضعفی است که حتی در مدلهای پیشرفتهتر نیز دیده میشود؛ بهطوری که برخی بنچمارکها شکست گسترده مدلهای بزرگ در استفاده از ابزارهای فیزیکی را نشان دادهاند.
- اجرای چندمرحلهای: ترکیب خروجیهای ابزارهای مختلف برای رسیدن به پاسخ نهایی.
در این سیستم، مدل مانند یک کنترلکننده عمل میکند و از توهم (Hallucination) — وقتی مدل با اطمینان چیزی میگوید که اصلاً وجود ندارد، شبیه دوستی که خاطرهای را اشتباه تعریف میکند — میگریزد. جریان کار به این صورت است: پرسش کاربر ← مدل زبانی ← انتخاب ابزار ← اجرای ابزار ← پاسخ نهایی. این رویکرد تفویضمحور، مشابه استراتژیهایی است که در مدلهای SearchSwarm برای ارتقای دقت در جستوجوهای پیچیده به کار گرفته شده است.
برای متخصصان، این یعنی هوش مصنوعی ارزانتر و قابلاستقرارتر میشود. شما میتوانید گردشهای کاری استدلالی را روی سختافزار محلی اجرا کنید بدون اینکه قابلیت فراخوانی API یا محاسبات پیچیده ریاضی را از دست بدهید. چنین انعطافپذیری در استقرار، یادآور تلاشهای اخیر برای ادغام قابلیتهای هوش مصنوعی در محیطهای توسعهای مانند PHP است تا سرعت توسعه برنامهها افزایش یابد.
گام بعدی شما
- مطالعه صفحات ۴۹۳ تا ۴۹۷ مقاله مذکور برای پیادهسازی ساختارهای پرامپت در استکهای محلی.
- تست مدلهای کوچک بازمتن با متدولوژی «کنترلکننده» بهجای تکیه بر دانش داخلی مدل.
- بررسی جایگزینی APIهای گرانقیمت با ترکیب SLM و ابزارهای تخصصی.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو