تلهٔ «ماشینِ مشغول»؛ دلیلِ شکستِ عامل‌های Claude Code در تولید کد واقعی

تصور کنید برنامه‌نویسی را استخدام کرده‌اید که تمام روز مشغول مرتب کردن پوشه‌هایش است، اما یک خط کد هم نمی‌نویسد. این دقیقاً همان چیزی است که در گزارش ۲۸ ژوئن ۲۰۲۶ در dev.to با عنوان «تلهٔ ماشینِ مشغول» توصیف شده است.

طبق این گزارش، در یک آزمایش یک‌ماهه روی Claude Code، مشاهده شد که این عامل (Agent) — شبیه کارمندی که برای فرار از کار سخت، میز خود را مرتب می‌کند — حجم عظیمی از فعالیت‌های داخلی مثل بازخوانی فایل‌ها یا سازماندهی یادداشت‌ها ایجاد می‌کند، اما در نهایت هیچ ویژگی جدیدی را به محصول اضافه نمی‌کند.

این شکست به این دلیل رخ می‌دهد که حلقه‌های خودگردان، نظارت انسانی لحظه‌ای ندارند تا متوجه توقف پیشرفت شوند. همان‌طور که در تحلیل قبلی ما درباره‌ی اثرات مخرب فایل‌های CLAUDE.md بر پیروی از دستورات اشاره کردیم، این مشکل ریشه‌ای‌تر است: مدل‌ها «فعالیت» را با «پیشرفت» اشتباه می‌گیرند.

به نقل از این گزارش، توسعه‌دهندگان می‌توانند با بررسی لاگ‌های جلسه در مسیر ~/.claude/projects/<project>/*.jsonl متوجه این بحران شوند. برای تسهیل این فرآیند، ابزارهایی مانند Her توسعه یافته‌اند که می‌توانند لاگ‌های پیچیده و حجیم این جلسات را به گزارش‌های متنی قابل‌فهم تبدیل کنند. نسبت تعداد دفعات اجرای دستورات به «دستاوردهای بیرونی» (مثل یک کامیت موفق یا انتشار یک URL) در بسیاری از موارد تکان‌دهنده است.

مکانیزم‌های توقف رانش عامل

برای خروج از این وضعیت، دو راهکار دفاعی پیشنهاد شده است:

دفتر ثبت دستاورد (Outcome Ledger): یک فایل ساده که فقط «رویدادهای بیرونی» را ثبت می‌کند. در این سیستم، سازماندهی داخلی به‌طور ساختاری به‌عنوان پیشرفت پذیرفته نمی‌شود.
گیت پیش‌از-اجرا (Pre-Action Gate): اجبار عامل به پاسخ به این سؤال که «چه کسی از این تسک سود می‌برد» و «کدام معیار طی ۱۴ روز آینده تغییر می‌کند»، پیش از مصرف حتی یک توکن (Token) — که مانند تکه‌های کوچک یک کیک است و مدل آن‌ها را تکه‌تکه می‌خورد.

این حفاظ‌ها مانع از «تخلیه هزینه» می‌شوند. چون متن‌های ارسال‌شده در هر نوبت دوباره محاسبه می‌شوند، یک جلسه طولانی اما بی‌هدف تبدیل به یک نشتی مالی گران‌قیمت می‌شود؛ موضوعی که پیش‌تر در گزارش یک توسعه‌دهنده درباره هزینه ۸۸۵۷ دلاری برای ۶ پروژه با Claude Code به وضوح دیده شد.

در این مدل، نقش انسان از یک کمک‌خلبان به یک «معمار سیستم» تغییر می‌کند که باید تعریف کند «موفقیت» در دفتر ثبت دستاورد چگونه است. بدون این محدودیت‌ها، عاملی که شب‌ها در حالی که شما می‌خوابید اجرا می‌شود، ریسک کراش کردن ندارد، بلکه ریسک یک ماه شکست نامرئی و گران را به همراه دارد.

شرکت‌ها می‌توانند این بررسی‌ها را با ابزار MIT-licensed cc-safe-setup پیاده کنند.

گام بعدی شما

لاگ‌های JSONL پروژه‌های خود را باز کنید و تعداد کامیت‌های موفق را با تعداد کل Turnها مقایسه کنید.
یک فایل Outcome Ledger برای عامل‌های خود تعریف کنید تا فقط خروجی‌های ملموس ثبت شوند.
از ابزار cc-safe-setup برای اتوماسیون این گیت‌های کنترلی استفاده کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مکانیزم‌های توقف رانش عامل

برای خروج از این وضعیت، دو راهکار دفاعی پیشنهاد شده است:

دفتر ثبت دستاورد (Outcome Ledger): یک فایل ساده که فقط «رویدادهای بیرونی» را ثبت می‌کند. در این سیستم، سازماندهی داخلی به‌طور ساختاری به‌عنوان پیشرفت پذیرفته نمی‌شود.
گیت پیش‌از-اجرا (Pre-Action Gate): اجبار عامل به پاسخ به این سؤال که «چه کسی از این تسک سود می‌برد» و «کدام معیار طی ۱۴ روز آینده تغییر می‌کند»، پیش از مصرف حتی یک توکن (Token) — که مانند تکه‌های کوچک یک کیک است و مدل آن‌ها را تکه‌تکه می‌خورد.

شرکت‌ها می‌توانند این بررسی‌ها را با ابزار MIT-licensed cc-safe-setup پیاده کنند.

گام بعدی شما

لاگ‌های JSONL پروژه‌های خود را باز کنید و تعداد کامیت‌های موفق را با تعداد کل Turnها مقایسه کنید.
یک فایل Outcome Ledger برای عامل‌های خود تعریف کنید تا فقط خروجی‌های ملموس ثبت شوند.
از ابزار cc-safe-setup برای اتوماسیون این گیت‌های کنترلی استفاده کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تلهٔ «ماشینِ مشغول»؛ دلیلِ شکستِ عامل‌های Claude Code در تولید کد واقعی

مکانیزم‌های توقف رانش عامل

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تلهٔ «ماشینِ مشغول»؛ دلیلِ شکستِ عامل‌های Claude Code در تولید کد واقعی

مکانیزم‌های توقف رانش عامل

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تلهٔ «ماشینِ مشغول»؛ دلیلِ شکستِ عامل‌های Claude Code در تولید کد واقعی

مکانیزم‌های توقف رانش عامل

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

تلهٔ «ماشینِ مشغول»؛ دلیلِ شکستِ عامل‌های Claude Code در تولید کد واقعی

مکانیزم‌های توقف رانش عامل

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

راهنمای فارسی هوش مصنوعی — با نگاه به ایران