اگر امروز یک عامل (Agent) — مثل کارمندی دیجیتال که ابزارهای مختلفی در دست دارد و تصمیم میگیرد از کدام استفاده کند — را در محیط عملیاتی رها کردهاید، احتمالاً با یک جعبه سیاه خطرناک دستوپنج نرم میکنید. تصور کنید سیستمی که مدیریت سفارشات شما را بر عهده دارد، بدون هیچ خطایی توکنها را میسوزاند و در نهایت در سکوت کامل شکست میخورد.
bسیاری از تیمها استقرار عاملها را به یک تمرین «منتشر کن و دعا کن» تبدیل کردهاند. همانطور که در تحلیل قبلی ما دربارهی نبود گاردهای کد-محور در ۸۳٪ از فراخوانهای ابزار اشاره کردیم، صنعت اکنون به سمت ردیابی سختگیرانه حرکت میکند. طبق گزارشهای تخصصی، این چرخش زمانی حیاتی است که عاملها از چتباتهای ساده فراتر روند و گردشهای کاری واقعی سازمان را فعال کنند. این سطح از اتوماسیون در مقیاس صنعتی پیش از این در تجربهی Anthropic برای تولید بخش بزرگی از کدهای عملیاتی توسط عاملها به چشم خورده است.
برای حل این مشکل، چارچوب R.A.H.S.I یک لایهی نظارت (Observability) — شبیه جعبه سیاه هواپیما که دقیقاً میگوید در لحظه بروز خطا چه اتفاقی افتاده است — معرفی میکند. به نقل از تحلیل آکاش راهسی در ۸ ژوئن ۲۰۲۶، یک پشتهی عملیاتی باید این چهار بردار را رصد کند:
- ردیابی پرامپت و پاسخ: تحلیل دستورالعملها برای متوقف کردن رفتارهای ناامن یا بیکیفیت.
- نظارت بر فراخوان ابزار: ردیابی ورودی و خروجی APIها، پایگاههای داده و ابزارهای MCP.
- پایش تأخیر: اندازهگیری زمان ارکستراسیون برای حذف اصطکاکهای عملیاتی.
- تحلیل شکست: شناسایی خطاهای Time-out و مسدودسازیهای سیاستی.
این رویکرد سیستماتیک برای تحلیل شکست، پیشنیاز پیادهسازی چرخههای خودکار است؛ مشابه آنچه در سیستم اتوماسیون وب Intuned برای شناسایی و اصلاح خودکار خطاها پیاده شده است.

این چارچوب از اوپن-تلومتری (OpenTelemetry) — مثل یک مترجم جهانی که گزارشهای مختلف سیستمها را به زبانی واحد تبدیل میکند — و Application Insights استفاده میکند. این ساختار تضمین میکند که یک درخواست کاربر، از زمان اجرا در عامل تا فراخوانی مدل و APIهای بکاند، بهطور کامل ردیابی شود.

برای هر توسعهدهنده یا مدیر محصول، این یعنی پایان ارزیابیهای «حسی». دیگر نمیپرسید که آیا عامل «به نظر» دقیق میرسد یا خیر؛ بلکه هزینه هر تسک و نرخ دخالت انسان را اندازه میگیرید. این تغییر، دادههای خام را به هوش تجاری تبدیل میکند و هوش مصنوعی را در برابر ترازنامه مالی شرکت پاسخگو میکند.
گام بعدی شما
- لاگهای فعلی عاملهای خود را برای «شکستهای خاموش» (جایی که ابزار بدون هشدار به کاربر Time-out میدهد) بررسی کنید.
- نرخ موفقیت واقعی را با دقت بنچمارک مدل مقایسه کنید؛ احتمالاً تفاوت زیادی خواهند داشت.
- پیادهسازی OpenTelemetry را برای متصل کردن ردپای مدل به نتایج تجاری آغاز کنید.
اما مدیریت هزینههای استنتاج (Inference) در این مقیاس چالش دیگری دارد — به تحلیل ما دربارهی بهینهسازی توکنها مراجعه کنید.

گفتگو