تصور کنید برنامهنویسی را استخدام کردهاید که تمام روز مشغول مرتب کردن پوشههایش است، اما یک خط کد هم نمینویسد. این دقیقاً همان چیزی است که در گزارش ۲۸ ژوئن ۲۰۲۶ در dev.to با عنوان «تلهٔ ماشینِ مشغول» توصیف شده است.
طبق این گزارش، در یک آزمایش یکماهه روی Claude Code، مشاهده شد که این عامل (Agent) — شبیه کارمندی که برای فرار از کار سخت، میز خود را مرتب میکند — حجم عظیمی از فعالیتهای داخلی مثل بازخوانی فایلها یا سازماندهی یادداشتها ایجاد میکند، اما در نهایت هیچ ویژگی جدیدی را به محصول اضافه نمیکند.
این شکست به این دلیل رخ میدهد که حلقههای خودگردان، نظارت انسانی لحظهای ندارند تا متوجه توقف پیشرفت شوند. همانطور که در تحلیل قبلی ما دربارهی اثرات مخرب فایلهای CLAUDE.md بر پیروی از دستورات اشاره کردیم، این مشکل ریشهایتر است: مدلها «فعالیت» را با «پیشرفت» اشتباه میگیرند.
به نقل از این گزارش، توسعهدهندگان میتوانند با بررسی لاگهای جلسه در مسیر ~/.claude/projects/<project>/*.jsonl متوجه این بحران شوند. برای تسهیل این فرآیند، ابزارهایی مانند Her توسعه یافتهاند که میتوانند لاگهای پیچیده و حجیم این جلسات را به گزارشهای متنی قابلفهم تبدیل کنند. نسبت تعداد دفعات اجرای دستورات به «دستاوردهای بیرونی» (مثل یک کامیت موفق یا انتشار یک URL) در بسیاری از موارد تکاندهنده است.
مکانیزمهای توقف رانش عامل
برای خروج از این وضعیت، دو راهکار دفاعی پیشنهاد شده است:
- دفتر ثبت دستاورد (Outcome Ledger): یک فایل ساده که فقط «رویدادهای بیرونی» را ثبت میکند. در این سیستم، سازماندهی داخلی بهطور ساختاری بهعنوان پیشرفت پذیرفته نمیشود.
- گیت پیشاز-اجرا (Pre-Action Gate): اجبار عامل به پاسخ به این سؤال که «چه کسی از این تسک سود میبرد» و «کدام معیار طی ۱۴ روز آینده تغییر میکند»، پیش از مصرف حتی یک توکن (Token) — که مانند تکههای کوچک یک کیک است و مدل آنها را تکهتکه میخورد.
این حفاظها مانع از «تخلیه هزینه» میشوند. چون متنهای ارسالشده در هر نوبت دوباره محاسبه میشوند، یک جلسه طولانی اما بیهدف تبدیل به یک نشتی مالی گرانقیمت میشود؛ موضوعی که پیشتر در گزارش یک توسعهدهنده درباره هزینه ۸۸۵۷ دلاری برای ۶ پروژه با Claude Code به وضوح دیده شد.
در این مدل، نقش انسان از یک کمکخلبان به یک «معمار سیستم» تغییر میکند که باید تعریف کند «موفقیت» در دفتر ثبت دستاورد چگونه است. بدون این محدودیتها، عاملی که شبها در حالی که شما میخوابید اجرا میشود، ریسک کراش کردن ندارد، بلکه ریسک یک ماه شکست نامرئی و گران را به همراه دارد.
شرکتها میتوانند این بررسیها را با ابزار MIT-licensed cc-safe-setup پیاده کنند.
گام بعدی شما
- لاگهای JSONL پروژههای خود را باز کنید و تعداد کامیتهای موفق را با تعداد کل Turnها مقایسه کنید.
- یک فایل Outcome Ledger برای عاملهای خود تعریف کنید تا فقط خروجیهای ملموس ثبت شوند.
- از ابزار cc-safe-setup برای اتوماسیون این گیتهای کنترلی استفاده کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو