هزینه ۱۰,۰۰۰ توکنی در هر Turn؛ چرا فایل‌های CLAUDE.md حافظه مدل را می‌سوزانند؟

اگر از فایل‌های دستورالعمل طولانی برای مدیریت کدها استفاده می‌کنید، احتمالاً هر بار ۱۰,۰۰۰ توکن از بودجه خود را دور می‌ریزید. این اتلاف نه تنها هزینه‌ها را بالا می‌برد، بلکه مدل شما را کندتر و به‌طور محسوسی «کودنویس بدتری» می‌کند.

بسیاری از برنامه‌نویسان برای تعریف استایل کدنویسی، فایل‌های CLAUDE.md را می‌سازند. این فایل‌ها در واقع بخشی از پنجره متنی (Context Window) — مثل میز کاری که جا برای چند ورق دارد، نه برای کل کتابخانه — هستند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی بهینه‌سازی عامل‌های هوش مصنوعی (AI Agents) اشاره کردیم، مدیریت حافظه کوتاه‌مدت مدل، کلید بهره‌وری است.

به نقل از عبدالرحمن صابر عبده (Abd Rahman Saber Abdo)، ۹۵ درصد تنظیمات عامل‌ها اصلاً به این فایل‌ها نیاز ندارند. طبق گزارش او، یک فایل استاندارد در هر Turn تمام محتوای خود را به مدل تزریق می‌کند. در مقابل، سیستم «مهارت‌ها» (Skills) از روش افشای تدریجی استفاده می‌کند. در این حالت، ابتدا فقط نام و شرح مهارت بارگذاری می‌شود که تنها ۵۰ توکن (Token) — مثل برش‌های کوچکی از یک کیک که مدل تکه‌تکه می‌خورد — هزینه دارد. مدل تنها زمانی متن کامل مهارت را می‌خواند که وظیفه کاربر با شرح آن مطابقت داشته باشد.

عبده برای پیاده‌سازی این سیستم، یک فرآیند بازگشتی را پیشنهاد می‌کند:

ابتدا گردش کار را شناسایی کنید
یک اجرای موفق داشته باشید
از مدل بخواهید مهارت را از روی آن اجرا بسازد
خطاها را اصلاح و مهارت را به‌روز کنید

بر اساس گزارش‌های منتشرشده در ۱۵ مه ۲۰۲۶، نسخه v2.1.100+ ابزار Claude Code با ۴۰ درصد تورم توکن‌ها مواجه شده است. این به‌روزرسانی باعث می‌شود حافظه مدل سریع‌تر پر شود و محدودیت‌های متنی زودتر فعال شوند.

Cover image for Your CLAUDE.md Is Wasting Tokens (And It's Probably Not Helping)

تحلیل فنی نشان می‌دهد مدلی که ۸۵ درصد ظرفیتش پر شده، به‌طور محسوسی ضعیف‌تر از مدلی است که تنها ۳۰ درصد حافظه‌اش اشغال شده است. فایل‌های حجیم، این حافظه فعال را با داده‌های ایستا پر می‌کنند و جایی برای کدهای زنده و خروجی ابزارها باقی نمی‌گذارند.

گام بعدی شما

فایل‌های دستورالعمل خود را بازبینی کنید و هر اطلاعاتی که مدل می‌تواند از خودِ کدبیس بفهمد را حذف کنید.
به جای لیست‌های طولانی، سیستم مهارت‌های تفکیک‌شده را پیاده کنید.
منتظر به‌روزرسانی‌های Claude Code یا Cursor برای پیاده‌سازی پیش‌فرض «بارگذاری تنبل» (Lazy-loading) باشید.

اما تأثیر این تغییرات بر هزینه‌های کلی استنتاج در مقیاس سازمانی حتی تکان‌دهنده‌تر است — به تحلیل ما درباره‌ی مدل‌های استدلالی مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

عبده برای پیاده‌سازی این سیستم، یک فرآیند بازگشتی را پیشنهاد می‌کند:

ابتدا گردش کار را شناسایی کنید
یک اجرای موفق داشته باشید
از مدل بخواهید مهارت را از روی آن اجرا بسازد
خطاها را اصلاح و مهارت را به‌روز کنید

Cover image for Your CLAUDE.md Is Wasting Tokens (And It's Probably Not Helping)

گام بعدی شما

فایل‌های دستورالعمل خود را بازبینی کنید و هر اطلاعاتی که مدل می‌تواند از خودِ کدبیس بفهمد را حذف کنید.
به جای لیست‌های طولانی، سیستم مهارت‌های تفکیک‌شده را پیاده کنید.
منتظر به‌روزرسانی‌های Claude Code یا Cursor برای پیاده‌سازی پیش‌فرض «بارگذاری تنبل» (Lazy-loading) باشید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

هزینه ۱۰,۰۰۰ توکنی در هر Turn؛ چرا فایل‌های CLAUDE.md حافظه مدل را می‌سوزانند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

هزینه ۱۰,۰۰۰ توکنی در هر Turn؛ چرا فایل‌های CLAUDE.md حافظه مدل را می‌سوزانند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

هزینه ۱۰,۰۰۰ توکنی در هر Turn؛ چرا فایل‌های CLAUDE.md حافظه مدل را می‌سوزانند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

هزینه ۱۰,۰۰۰ توکنی در هر Turn؛ چرا فایل‌های CLAUDE.md حافظه مدل را می‌سوزانند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران