آیا تیم محصول شما واقعاً میداند «پایان کار» یعنی چه، یا فقط بر اساس حس و حال (Vibes) تصمیم میگیرند؟ اگر نتوانید موفقیت را با زبانی قابل تست تعریف کنید، عاملهای هوشمند (AI Agents) شما یا شکست میخورند یا بدتر از آن، نتایجی کاملاً غلط اما متقاعدکننده تولید میکنند.
در ۶ مه ۲۰۲۶، شرکت Anthropic ابزار Managed Agents را روانه بازار کرد و در این میان، قابلیتی حیاتی به نام Outcomes را معرفی نمود. به نقل از گزارش dev.to، این سیستم به کاربران اجازه میدهد معیارهای موفقیت دقیقی را تعریف کنند تا یک مدل ارزیاب مجزا، وضعیت تکمیل تسک یا نیاز به تکرار آن را بررسی کند.
این سازوکار، شکافی عمیق را در مدیریت محصول مدرن آشکار میکند. برای اینکه Outcomes بهدرستی عمل کند، موفقیت باید به زبانی بیان شود که مدل بتواند بدون تکرار کل فرآیند، آن را ارزیابی کند. بر اساس مستندات Anthropic، این معیارها باید سه ویژگی داشته باشند:
- مشاهدهپذیر (Observable): مثلاً «ایمیل باید ظرف ۳۰ ثانیه ارسال شود».
- تجزیهپذیر (Decomposable): شکستن یک ویژگی به گامهای کوچک و قابل تست.
- دقیق (Specific): جایگزینی توصیفات مبهم با ناورداهای (Invariants) concrete.
این چرخش، نیازی فوری به IntentSpec ایجاد میکند؛ یک سند ساختاریافته که اهداف، حالتهای مرزی (Edge Cases) و محدودیتها را پیش از تبدیل به JSON تعریف میکند. در حالی که برنامهنویسان انسانی در پر کردن شکافهای یک تیکت مبهم استاد هستند، عاملهای عاملمحور (Agentic) دقیقاً و فقط طبق آنچه به آنها داده شده اجرا میکنند.
همانطور که در تحلیل قبلی ما دربارهی سرمایهگذاریهای زیرساختی Anthropic در گوگل کلاد اشاره کردیم، این حرکت نشاندهنده گذار از تمرکز بر قدرت خام مدلها به سمت دقت در تحویل است. اکنون هزینه یک تیکت مبهم، دیگر یک جلسه ساده برای شفافسازی نیست، بلکه یک اجرای شکستخورده و هزینهبر در سطح استنتاج (Inference) است.
اما این تنها بخشی از معماست؛ آیا میتوان این مشخصات را بهطور خودکار از مستندات قدیمی استخراج کرد؟ پاسخ در تحلیل ما از آیندهی استخراج دانش نهفته است.
گام بعدی شما
- تیکتهای فعلی محصول خود را بررسی کنید و صفتهای مبهم (مانند «سریع» یا «بهینه») را با اعداد جایگزین کنید.
- با قابلیت Outcomes در کنسول Anthropic برای تعریف معیارهای موفقیت آزمایش کنید.
- برای یک گردشکار ساده، یک IntentSpec اولیه بنویسید تا تفاوت دقت عامل را مشاهده کنید.




گفتگو