تصور کنید ۱۶۰۰ دلار هزینه کنید تا یک عامل کدنویسی، صدها خط گزارش تکراری گیت را بخواند. این کابوس تورم توکن (Token-bloat) است که بسیاری از کاربران Claude Code با آن دستوپنجه نرم میکنند.
در ۷ مه ۲۰۲۶، جامعه توسعهدهندگان ابزار rtk (Rust Token Killer) را معرفی کردند؛ یک فایل باینری ۴ مگابایتی با زبان Rust که برای رهگیری دستورات شلوغ پوسته طراحی شده است. به نقل از مستندات این پروژه در dev.to، این ابزار با بازگرداندن خلاصههای فشرده و بهینه برای مدل زبانی بزرگ (LLM) به جای خروجیهای خام ترمینال، مصرف توکن را ۶۰ تا ۹۰ درصد کاهش میدهد.

این ابزار به عنوان یک پروکسی خط فرمان (CLI Proxy) عمل میکند. به جای اجرای مستقیم دستور git status توسط عامل (Agent)، فراخوانی rtk git status صورت میگیرد. این سازوکار باعث میشود پیشنهادات طولانی فیلتر شده و فایلها بر اساس وضعیتشان گروهبندی شوند تا مدل مجبور نباشد برای دادههای تکراری در طول یک نشست، هزینه پرداخت کند.
طبق گزارش توسعهدهندگان، قابلیتهای کلیدی فیلترینگ عبارتند از:
- Git/GitHub CLI: حذف پیشنهادات طولانی و فشردهسازی سرتیترهای بخشها.
- اجراکنندههای تست: حذف خطوط پیشرفت در cargo test، pytest و jest و حفظ تنها پیامهای خطا.
- عملیات فایل: تبدیل لیستهای تخت دستور
findبه درختهای بهینه شده برای توکن.

در حالی که rtk در مرز دستورات فیلتر میکند، روش context-mode استراتژی متفاوتی را از طریق ایزولهسازی (Sandboxing) دنبال میکند. این جایگزین میتواند در حجمهای بالای لاگ، تا ۹۸ درصد کاهش هزینه ایجاد کند؛ چرا که دادههای خام را روی دیسک نگه داشته و تنها خلاصهها را از طریق مدل «اندیسگذاری و بازیابی» به گفتگو میفرستد.

این چرخش به سمت «مهندسی بافت» در حالی رخ میدهد که صنعت دریافته است پنجرههای بافت بزرگتر، همیشه به معنای افزایش توانایی نیستند. همانطور که در تحلیل قبلی ما دربارهی استراتژی سختافزاری آنتروپیک (Anthropic) و تجهیز آن به ۲۲۰ هزار GPU اشاره کردیم، تمرکز اکنون از ظرفیت خام به سمت بهرهوری عملیاتی تغییر کرده است. ارزانترین توکن، توکنی است که هرگز ارسال نشود.

با حرکت ابزارهایی مانند Cursor و Codex به سمت بودجهبندی داخلی خروجیها، احتمالاً دوران پروکسیهای شخص ثالث به زودی به پایان میرسد و کنترل هزینهها مستقیماً در محیط اجرا ادغام خواهد شد.
اما این تنها آغاز ماجراست؛ اثر موجگونهی این بهینهسازیها بر اکوسیستم مدلهای استدلالی را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- نصب rtk برای مدیریت خروجیهای CLI و کاهش هزینههای API.
- بررسی استراتژی sandboxing در context-mode برای پروژههایی با لاگهای حجیم.
- تحلیل الگوهای مصرف توکن در نشستهای طولانی برای شناسایی نقاط تورم.




گفتگو