rtk: کاهش ۶۰ تا ۹۰ درصدی هزینه‌های توکن در Claude Code

تصور کنید ۱۶۰۰ دلار هزینه کنید تا یک عامل کدنویسی، صدها خط گزارش تکراری گیت را بخواند. این کابوس تورم توکن (Token-bloat) است که بسیاری از کاربران Claude Code با آن دست‌وپنجه نرم می‌کنند.

در ۷ مه ۲۰۲۶، جامعه توسعه‌دهندگان ابزار rtk (Rust Token Killer) را معرفی کردند؛ یک فایل باینری ۴ مگابایتی با زبان Rust که برای رهگیری دستورات شلوغ پوسته طراحی شده است. به نقل از مستندات این پروژه در dev.to، این ابزار با بازگرداندن خلاصه‌های فشرده و بهینه برای مدل زبانی بزرگ (LLM) به جای خروجی‌های خام ترمینال، مصرف توکن را ۶۰ تا ۹۰ درصد کاهش می‌دهد.

Shidhin on X: Your Claude Code sessions are wasting 89% of tokens. It's not your prompts — it's raw terminal output getting dumped into context.

این ابزار به عنوان یک پروکسی خط فرمان (CLI Proxy) عمل می‌کند. به جای اجرای مستقیم دستور git status توسط عامل (Agent)، فراخوانی rtk git status صورت می‌گیرد. این سازوکار باعث می‌شود پیشنهادات طولانی فیلتر شده و فایل‌ها بر اساس وضعیتشان گروه‌بندی شوند تا مدل مجبور نباشد برای داده‌های تکراری در طول یک نشست، هزینه پرداخت کند.

طبق گزارش توسعه‌دهندگان، قابلیت‌های کلیدی فیلترینگ عبارتند از:

Git/GitHub CLI: حذف پیشنهادات طولانی و فشرده‌سازی سرتیترهای بخش‌ها.
اجراکننده‌های تست: حذف خطوط پیشرفت در cargo test، pytest و jest و حفظ تنها پیام‌های خطا.
عملیات فایل: تبدیل لیست‌های تخت دستور find به درخت‌های بهینه شده برای توکن.

Hacker News Show HN: RTK – Wrap your CLI commands, save 60-90% of tokens in AI coding agents

در حالی که rtk در مرز دستورات فیلتر می‌کند، روش context-mode استراتژی متفاوتی را از طریق ایزوله‌سازی (Sandboxing) دنبال می‌کند. این جایگزین می‌تواند در حجم‌های بالای لاگ، تا ۹۸ درصد کاهش هزینه ایجاد کند؛ چرا که داده‌های خام را روی دیسک نگه داشته و تنها خلاصه‌ها را از طریق مدل «اندیس‌گذاری و بازیابی» به گفتگو می‌فرستد.

Kilo Code discussion thread: I saved 10M tokens (89%) on my Claude Code sessions with a CLI proxy

این چرخش به سمت «مهندسی بافت» در حالی رخ می‌دهد که صنعت دریافته است پنجره‌های بافت بزرگ‌تر، همیشه به معنای افزایش توانایی نیستند. همان‌طور که در تحلیل قبلی ما درباره‌ی استراتژی سخت‌افزاری آنتروپیک (Anthropic) و تجهیز آن به ۲۲۰ هزار GPU اشاره کردیم، تمرکز اکنون از ظرفیت خام به سمت بهره‌وری عملیاتی تغییر کرده است. ارزان‌ترین توکن، توکنی است که هرگز ارسال نشود.

Jason Zhou on X recommending RTK as the best open-source tool for reducing Claude Code tokens up to 60%

با حرکت ابزارهایی مانند Cursor و Codex به سمت بودجه‌بندی داخلی خروجی‌ها، احتمالاً دوران پروکسی‌های شخص ثالث به زودی به پایان می‌رسد و کنترل هزینه‌ها مستقیماً در محیط اجرا ادغام خواهد شد.

اما این تنها آغاز ماجراست؛ اثر موج‌گونه‌ی این بهینه‌سازی‌ها بر اکوسیستم مدل‌های استدلالی را در گزارش بعدی بررسی خواهیم کرد.

گام بعدی شما

نصب rtk برای مدیریت خروجی‌های CLI و کاهش هزینه‌های API.
بررسی استراتژی sandboxing در context-mode برای پروژه‌هایی با لاگ‌های حجیم.
تحلیل الگوهای مصرف توکن در نشست‌های طولانی برای شناسایی نقاط تورم.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

Shidhin on X: Your Claude Code sessions are wasting 89% of tokens. It's not your prompts — it's raw terminal output getting dumped into context.

طبق گزارش توسعه‌دهندگان، قابلیت‌های کلیدی فیلترینگ عبارتند از:

Git/GitHub CLI: حذف پیشنهادات طولانی و فشرده‌سازی سرتیترهای بخش‌ها.
اجراکننده‌های تست: حذف خطوط پیشرفت در cargo test، pytest و jest و حفظ تنها پیام‌های خطا.
عملیات فایل: تبدیل لیست‌های تخت دستور find به درخت‌های بهینه شده برای توکن.

Hacker News Show HN: RTK – Wrap your CLI commands, save 60-90% of tokens in AI coding agents

Kilo Code discussion thread: I saved 10M tokens (89%) on my Claude Code sessions with a CLI proxy

Jason Zhou on X recommending RTK as the best open-source tool for reducing Claude Code tokens up to 60%

گام بعدی شما

نصب rtk برای مدیریت خروجی‌های CLI و کاهش هزینه‌های API.
بررسی استراتژی sandboxing در context-mode برای پروژه‌هایی با لاگ‌های حجیم.
تحلیل الگوهای مصرف توکن در نشست‌های طولانی برای شناسایی نقاط تورم.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

rtk: کاهش ۶۰ تا ۹۰ درصدی هزینه‌های توکن در Claude Code

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

rtk: کاهش ۶۰ تا ۹۰ درصدی هزینه‌های توکن در Claude Code

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

rtk: کاهش ۶۰ تا ۹۰ درصدی هزینه‌های توکن در Claude Code

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

کاهش پیچیدگی استقرار عامل‌های AI با یک قالب داده‌ای واحد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

rtk: کاهش ۶۰ تا ۹۰ درصدی هزینه‌های توکن در Claude Code

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

کاهش پیچیدگی استقرار عامل‌های AI با یک قالب داده‌ای واحد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران