اگر از عاملهای کدنویسی برای پروژههای بزرگ استفاده میکنید، احتمالاً با کابوس فایلهای نیمهتمام و مسیرهای بنبست آشنا هستید. حقیقت این است که بدون یک نقشه دقیق، هوش مصنوعی زاینده (Generative AI) بهسرعت از مسیر اصلی خارج میشود و کد شما را به یک «کلاف سردرگم» تبدیل میکند. در واقع، عاملهای هوش مصنوعی اغلب با منحرف شدن از قصد اولیه توسعهدهنده، مجموعهای از نقاط کور و فایلهای ناقص ایجاد میکنند.
طبق گزارش منتشر شده در ۵ جولای ۲۰۲۶ در وبسایت dev.to، یک blueprint یا نقشه راه ۶ مرحلهای برای Claude Code توانسته است نرخ انحراف پروژه (Project Drift) را تا ۷۰٪ کاهش دهد؛ بهطوری که نرخ خطای کلی از ۴۰٪ به ۱۲٪ رسیده است.
برنامهنویسی عاملمحور (Agentic Coding) — شبیه این است که به یک کارآموز بسیار سریع اما بیتجربه دستور دهید؛ او کدها را سریع مینویسد اما اگر دقیقاً نداند چه میخواهد، زمان و هزینه را تلف میکند. این مشکل عدم جهتگیری، منجر به اتلاف زمان و مصرف بیمورد توکنها میشود. این شکاف بهرهوری مشابه الگوهایی است که در بخشهای دیگر دیدهایم؛ برای مثال، شرکت itelnet Consulting پیشتر از طریق مهندسی دستورات (Prompting) عمومی برای بهینهسازی برنامهریزی دروس AI، توانست هزینههای عملیاتی دستی را کاهش دهد. در این راستا، برخی متخصصان بر این باورند که جایگزینی پرامپتهای دستی با Loop Engineering میتواند مسیر را برای خودکارسازی کامل عاملها هموار کند. همانطور که در تحلیل قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، نبودِ ساختار در تعامل با مدلهای زبانی، همیشه منجر به نتایج غیرقابلپیشبینی میشود.
هزینهٔ انحراف پروژه
انحراف پروژه از نظر اقتصادی برای توسعهدهندگانی گران تمام میشود، بهویژه وقتی بحث اقتصاد توکنها مطرح باشد. در یک پروژه معمولی با ۵۰,۰۰۰ توکن (Token) — که مثل برشهای کوچک یک کیک هستند و مدل آنها را تکهتکه میخورد — این متدولوژی حدود ۱۴,۰۰۰ توکن در هر جلسه صرفهجویی میکند. این تلاش برای بهینهسازی مصرف منابع، مشابه رویکردی است که در معماری TokenFold برای کاهش ۳۰ درصدی هزینههای عاملها شاهد بودهایم.
اگر مرحلهی مشخصات (Specification) نادیده گرفته شود، بهطور متوسط ۳۰٪ از توکنها صرف کدهایی میشوند که در نهایت دور ریخته میشوند. این یعنی در هر جلسه ۳ دلاری، تقریباً ۰.۹۰ دلار هزینه اضافی بابت کدهای بلااستفاده پرداخت میشود.

بر اساس مستندات این متدولوژی، حیاتیترین بخش، «فاز ۱: اولویت با مشخصات» است. این مرحله با اجبار کاربر به تعریف داستانهای کاربر (User Stories)، معیارهای موفقیت و محدودیتهای فنی در کمتر از ۵۰۰ کلمه، پیش از آنکه حتی یک خط کد نوشته شود، بهتنهایی نرخ انحراف را ۳۰٪ کم میکند.
برای اجرای این روند در Claude Code، از دستور claude code --spec "Create a spec for [project]" استفاده کنید و در طول جلسه، از مدل بخواهید موارد زیر را لحاظ کند:
- داستانهای کاربر (User stories)
- معیارهای موفقیت (Success criteria)
- اهداف غیرضروری (Non-goals)
- محدودیتهای فنی (Technical constraints)
این سند در واقع تبدیل به «ستاره قطبی» پروژه میشود تا مدل در طول مسیر گم نشود و همواره به هدف اصلی بازگردد.
جزئیات مراحل گردشکار
پیادهسازی کامل این سیستم از یک توالی سختگیرانه تشکیل شده است که عناصری از Spec Kit, Superpowers و GStack را با هم ادغام میکند:
- فاز ۲: برنامهریزی معماری (کاهش ۱۵٪ انحراف): در این مرحله از سرورهای MCP (Model Context Protocol) متعلق به Superpowers برای تحلیل محدودیتهای کدبیس استفاده میشود. پرامپت ارسالی باید مدل را ملزم کند تا لیستی از فایلها، مسئولیتهای هر فایل، جریان دادهها (Data Flow) و یک نمودار وابستگیها (Dependency Graph) را برای تایید توسعهدهنده ارائه دهد، پیش از آنکه پیادهسازی آغاز شود. این تحلیل ساختاری یادآور ابزاری مانند CodeGraph است که توانست با درک بهتر بافت کد، مصرف توکنها را تا ۶۴٪ کاهش دهد.
- فاز ۳: تجزیهٔ تکالیف (کاهش ۱۰٪ انحراف): در اینجا از اصول GStack برای شکستن اهداف کلی به تکالیف اتمی استفاده میشود. هر تکلیف باید دارای چهار ویژگی باشد: ۱. در یک جلسه قابل تکمیل باشد، ۲. کمتر از ۵۰ خط کد یا در یک فایل باشد، ۳. دارای یک تست مشخص «پاس/فیل» باشد، و ۴. به جزئیات پیادهسازی تکالیف دیگر وابسته نباشد.
- فاز ۴: پیادهسازی (کاهش ۱۰٪ انحراف): این فاز مستلزم ایجاد نقاط بازرسی (Checkpoints) و Commitها پس از هر تکالیف است. استفاده از دستور
claude code --task "Implement task [X]" --checkpointمانع از این میشود که عامل در مسیرهای غلط منحرف شود. - فاز ۵: آزمایش (کاهش ۳٪ انحراف): تمرکز این مرحله بر نوشتن تستها قبل از نوشتن کد (در هر جای ممکن) است تا رفتار سیستم تثبیت و قفل شود.
- فاز ۶: بازبینی (کاهش ۲٪ انحراف): در نهایت، خروجی نهایی با مشخصات اولیه (Spec) مقایسه میشود. اگر پروژه از مسیر منحرف شده باشد، توسعهدهنده باید کد را به آخرین نقطه بازرسی (Checkpoint) بازگرداند.

این رویکرد، بار ذهنی برنامهنویس را از این پرسش که «گام بعدی چیست؟» به این عمل ساده تغییر میدهد که «آیا عامل معیارهای خروجی این فاز را پاس کرده است یا خیر؟». این تغییر نشان میدهد که گلوگاه اصلی در کدنویسی عاملمحور، نبودِ هوش مدل نیست، بلکه نبود یک فرآیند استاندارد است. ابزارهایی مانند Claude Code هرچقدر هم قدرتمند باشند، بدون یک «تابع اجباری» (Forcing Function) برای نگه داشتن آنها در مسیر درست، بیهدف باقی میمانند.
نکات کاربردی و محدودیتها
باید توجه داشت که اگرچه این دستاوردها توسط پذیرندگان اولیه گزارش شده است، اما هنوز بر اساس آزمایشهای کنترلشده (Controlled Trials) نیست. این blueprint برای پروژههای جدید (Greenfield) ایدهآل است؛ اما برای کدبیسهای موجود، فاز ۱ باید تغییر کند و بهجای مشخصات جدید، بر روی محدودیتهای فعلی متمرکز شود. همچنین، اگر کل پروژه کمتر از ۱۰۰ خط کد باشد، کاربران میتوانند از فازهای ۲ و ۳ عبور کرده و مستقیماً از مشخصات به پیادهسازی بروند.
برای شروع، یک فایل CLAUDE.md بسازید و قوانین تجزیه تکالیف را در آن قرار دهید. همچنین تا زمانی که مشخصات اولیه تایید نشده است، اجازه انتقال به مرحله برنامهریزی معماری را ندهید. برای ردیابی انحراف خود، تعداد خطوط کدهای دور ریخته شده را بشمارید؛ اگر نرخ دور ریختن کدها بالای ۲۰٪ است، پروژه شما نیاز به ساختار بیشتری دارد.
گام بعدی شما
- فایل CLAUDE.md را برای تعریف قوانین سختگیرانه در تجزیه تکالیف ایجاد کنید.
- دستور
--checkpointرا به روتین کاری خود در Claude Code اضافه کنید تا بازگشت به عقب آسانتر شود. - نرخ «کدهای دور ریخته شده» خود را محاسبه کنید تا متوجه شوید کجاها دچار انحراف میشوید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو