اگر از فایلهای دستورالعمل طولانی برای مدیریت کدها استفاده میکنید، احتمالاً هر بار ۱۰,۰۰۰ توکن از بودجه خود را دور میریزید. این اتلاف نه تنها هزینهها را بالا میبرد، بلکه مدل شما را کندتر و بهطور محسوسی «کودنویس بدتری» میکند.
بسیاری از برنامهنویسان برای تعریف استایل کدنویسی، فایلهای CLAUDE.md را میسازند. این فایلها در واقع بخشی از پنجره متنی (Context Window) — مثل میز کاری که جا برای چند ورق دارد، نه برای کل کتابخانه — هستند. همانطور که در تحلیلهای پیشین ما دربارهی بهینهسازی عاملهای هوش مصنوعی (AI Agents) اشاره کردیم، مدیریت حافظه کوتاهمدت مدل، کلید بهرهوری است.
به نقل از عبدالرحمن صابر عبده (Abd Rahman Saber Abdo)، ۹۵ درصد تنظیمات عاملها اصلاً به این فایلها نیاز ندارند. طبق گزارش او، یک فایل استاندارد در هر Turn تمام محتوای خود را به مدل تزریق میکند. در مقابل، سیستم «مهارتها» (Skills) از روش افشای تدریجی استفاده میکند. در این حالت، ابتدا فقط نام و شرح مهارت بارگذاری میشود که تنها ۵۰ توکن (Token) — مثل برشهای کوچکی از یک کیک که مدل تکهتکه میخورد — هزینه دارد. مدل تنها زمانی متن کامل مهارت را میخواند که وظیفه کاربر با شرح آن مطابقت داشته باشد.

عبده برای پیادهسازی این سیستم، یک فرآیند بازگشتی را پیشنهاد میکند:
- ابتدا گردش کار را شناسایی کنید
- یک اجرای موفق داشته باشید
- از مدل بخواهید مهارت را از روی آن اجرا بسازد
- خطاها را اصلاح و مهارت را بهروز کنید

بر اساس گزارشهای منتشرشده در ۱۵ مه ۲۰۲۶، نسخه v2.1.100+ ابزار Claude Code با ۴۰ درصد تورم توکنها مواجه شده است. این بهروزرسانی باعث میشود حافظه مدل سریعتر پر شود و محدودیتهای متنی زودتر فعال شوند.

تحلیل فنی نشان میدهد مدلی که ۸۵ درصد ظرفیتش پر شده، بهطور محسوسی ضعیفتر از مدلی است که تنها ۳۰ درصد حافظهاش اشغال شده است. فایلهای حجیم، این حافظه فعال را با دادههای ایستا پر میکنند و جایی برای کدهای زنده و خروجی ابزارها باقی نمیگذارند.
گام بعدی شما
- فایلهای دستورالعمل خود را بازبینی کنید و هر اطلاعاتی که مدل میتواند از خودِ کدبیس بفهمد را حذف کنید.
- به جای لیستهای طولانی، سیستم مهارتهای تفکیکشده را پیاده کنید.
- منتظر بهروزرسانیهای Claude Code یا Cursor برای پیادهسازی پیشفرض «بارگذاری تنبل» (Lazy-loading) باشید.
اما تأثیر این تغییرات بر هزینههای کلی استنتاج در مقیاس سازمانی حتی تکاندهندهتر است — به تحلیل ما دربارهی مدلهای استدلالی مراجعه کنید.
گفتگو