شکست عاملهای شما احتمالاً تقصیر مدل نیست، بلکه تقصیر قفسی است که در آن زندانی شدهاند. اگر هنوز از یک سیستم پرامپت واحد برای مدلهای مختلف استفاده میکنید، در واقع دارید پتانسیل واقعی هوش مصنوعی زاینده (Generative AI) را میکُشید.
به نقل از وبلاگ رسمی LangChain، این شرکت پروفایلهای هارنس (Harness Profiles) را برای عاملهای عمیق (Deep Agents) عرضه کرده است. هدف این است که به جای یک سیستم پرامپت عمومی، از بهینهسازیهای اختصاصی برای هر خانواده از مدلها استفاده شود تا هر مدل دقیقاً طبق دستورالعملهای سازندهاش رفتار کند.
نتایج این تغییر تکاندهنده است. بر اساس مستندات این شرکت، در بخشی از بنچمارک tau2-bench، نتایج زیر ثبت شده است:
- مدل GPT 5.3 Codex: جهش عملکرد از ۳۳٪ به ۵۳٪
- مدل Claude Opus 4.7: افزایش عملکرد از ۴۳٪ به ۵۳٪
این یعنی یک بهبود ۱۰ تا ۲۰ واحدی نسبت به حالت پیشفرض.

این بهینهسازی روی سه محور اصلی تمرکز دارد: پرامپتها، ابزارها و میانافزار (Middleware). برای مدل Codex، شرکت LangChain ابزار پیشفرض file_edit را با apply_patch جایگزین کرد و دستور execute را به shell_command تغییر داد تا با راهنمای پیادهسازی OpenAI همراستا شود.

همانطور که در تحلیل قبلی ما دربارهی چالشهای همراستاسازی (Alignment) مدلهای استدلالی اشاره کردیم، هر مدل منطق متفاوتی برای پردازش دارد. در مورد Claude Opus، تمرکز روی استدلال (Reasoning) بود. تگهای جدیدی مانند <tool_result_reflection> اضافه شدند تا مدل را مجبور کنند پیش از هر اقدام، خروجی ابزار را ارزیابی کند و به جای تکیه بر حافظه، تحقیقات فعال انجام دهد.

این پروفایلها به صورت لایههای بازنویسی اظهاری (Declarative Override Layers) از طریق YAML یا پایتون پیاده شدهاند. این بهروزرسانی هماکنون برای پایتون در دسترس است و بهزودی برای TypeScript منتشر میشود.
این تنها آغاز ماجراست؛ اثر موجگونهی این تصمیم بر اکوسیستم متنباز را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر از LangChain استفاده میکنید، فوراً پروفایلهای اختصاصی مدل خود را در فایلهای YAML تعریف کنید.
- ابزارهای عمومی خود را با جایگزینهای مدل-محور (مانند
apply_patchبرای مدلهای OpenAI) بهروزرسانی کنید. - در مدلهای Claude، تگهای بازتابی (Reflection Tags) را برای کاهش توهمات در زنجیره تفکر اضافه کنید.




گفتگو