اگر برنامهنویسی هستید که عامل هوش مصنوعیاش در محیط تست عالی عمل میکند اما در محیط عملیاتی شروع به بافتن دروغ میکند، مشکل از مدل شما نیست؛ بلکه طراحی زمینه یا همان کانتکست شماست که ایراد دارد.
بسیاری از توسعهدهندگان وقتی یک عامل شکست میخورد، بهطور غریزی GPT-4 را با Claude یا Gemini عوض میکنند. اما ریشهی مشکل معمولاً اطلاعاتی است که درست در لحظهی تصمیمگیری به مدل داده میشود.
عاملهای خودکار وقتی وارد جریانهای کاری واقعی میشوند، با پدیدهای به نام «پوسیدگی زمینه» مواجه میشوند. در این حالت، نسبت سیگنال به نویز کاهش مییابد و مدل دچار «سوگیری تازگی» میشود. یعنی دستوراتی که ۸۰۰۰ توکن عقبتر در یک پنجره متنی (Context Window) — که شبیه میز کاری است و فقط فضای محدودی برای چند ورق کاغذ دارد، نه کل کتابخانه — دفن شدهاند، اثر خود را از دست میدهند.
همانطور که در تحلیلهای قبلی ما دربارهی توهمات مدلهای زبانی اشاره کردیم، پایداری سیستم به مدیریت دقیق ورودیها وابسته است. به نقل از راهنمایی که در ۶ ژوئن ۲۰۲۶ در سایت dev.to منتشر شد، برای رسیدن به قابلیت اطمینان باید از پنج تکنیک مبنیسازی استفاده کرد:
- تعریف فضای منفی: مشخص کردن دقیق کارهایی که عامل «نباید» انجام دهد.
- تزریق با وزن اولویتدار: حفظ دستورات کلیدی در برابر تاریخچهی قدیمی گفتگو.
- مهار قیود: قرار دادن محدودیتها درست قبل از فراخوانی ابزار برای جلوگیری از انحراف دستورات.
- اشیاء وضعیت ساختاریافته: جایگزینی تاریخچهی خام گفتگو با اشیایی که وضعیت فعلی را بهصورت منظم توصیف میکنند.
- درگاههای اطمینان: افزودن یک لایه تأییدی برای فراخوانیهای حساس API.
این چرخش، نقش توسعهدهنده را از مهندسی پرامپت (Prompt Engineering) — که شبیه هنر سؤال درست پرسیدن از یک مشاور باتجربه است — به «طراحی محیط اطلاعات» تغییر میدهد. شما دیگر فقط یک درخواست نمینویسید، بلکه یک جریان دادهی پویا را مدیریت میکنید. در پشتهی تولید شما، این یعنی زمان بیشتری باید صرف توصیف ابزارها و مدیریت وضعیت شود تا تنظیم دقیق (Fine-tuning) — که مثل تخصص دادن به یک پزشک عمومی است تا روی یک حوزه خاص تمرکز کند — وزنهای مدل.
گام بعدی شما
- توصیفات ابزارهای خود را برای حذف هرگونه ابهام بازبینی کنید.
- ساختار تاریخچهی گفتگوهای مدل خود را از متن خام به اشیاء وضعیت (State Objects) تغییر دهید.
- برای APIهای حساس، یک «درگاه اطمینان» (Confidence Gate) طراحی کنید تا از اجرای اشتباه جلوگیری شود.
اما اثر این رویکرد بر هماهنگی میان چندین عامل مختلف حتی پیچیدهتر است — در گزارش بعدی، معماری سیستمهای چند-عامله را بررسی خواهیم کرد.
گفتگو