اگر هنوز صورتحساب مشتریان خود را بر اساس تخمینهای تقریبی توکنها مینویسید، احتمالاً هر ماه بخشی از درآمد خود را از دست میدهید. باید بدانید که تخمینهای رایج در دنیای هوش مصنوعی زاینده (Generative AI) بهشدت غیرقابلاعتماد هستند و همینجاست که Halton Meter وارد عمل میشود تا هیچ درخواست API بدون محاسبه باقی نماند.
برای استودیوهای نرمافزاری، شکاف بین «هزینه تخمینی» و «هزینه واقعی» اغلب باعث سلب اعتماد مشتری میشود. در واقع ما با مدل زبانی بزرگ (LLM) — تشبیه روزمره: مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — سروکار داریم که هر پاسخ آن با توکن (Token) — تشبیه روزمره: تکههای کوچکی از متن، مثل برشهای یک کیک طولانی که مدل تکهتکه میخورد — اندازهگیری میشود. همانطور که در تحلیل قبلی ما دربارهی بهینهسازی حافظه در ion7-core اشاره کردیم، صنعت اکنون از مرحلهی «فقط اجرا کردن» به مرحلهی «مشاهدهپذیری دقیق عملیاتی» حرکت کرده است تا هزینههای مدلهای پیشرو را مدیریت کند.
به نقل از گزارشی که در ۸ مئی ۲۰۲۶ در وبسایت dev.to منتشر شد، Halton Meter به عنوان یک دیمون (Daemon) مبتنی بر mitmproxy در سطح محلی عمل میکند. این ابزار از یک پراکسی (Proxy) — تشبیه روزمره: مثل یک واسطه یا پستچی که نامهها را قبل از تحویل میخواند و ثبت میکند — استفاده میکند تا ترافیک خروجی را شنود کرده و بر اساس قیمتهای اعلامشده، هزینهها را در یک پایگاه داده SQLite ذخیره کند.
بر اساس مستندات فنی این پروژه، ویژگیهای کلیدی آن عبارتند از:
- پشتیبانی از ۶ آداپتور برای ۴ ارائهدهنده اصلی: Claude، OpenAI، Gemini و Grok.
- ردیابی همزمان فراخوانهای مستقیم SDK و سطوح OAuth، از جمله ChatGPT و Gemini Code Assist.
- معماری سه-پردازشی شامل شنودگر لبه (پورت ۸۰۸۱)، متوقفکننده پراکسی (پورت ۸۰۹۰) و API بازگشتی (پورت ۸۷۶۵).

نکتهی طلایی این است که این ابزار به هیچ تغییری در کد نیاز ندارد؛ یعنی اسکریپتها و نوتبوکهای شما بدون تغییر در منطق برنامه، بهطور خودکار ردیابی میشوند.

این مکانیسم، مسئلهی ردیابی هزینه را از لایهی اپلیکیشن به لایهی شبکه منتقل میکند. با استفاده از پراکسی به جای Wrapperهای SDK، این ابزار حتی «مصارف سایهی» AI — مانند دستیارهای کدنویسی در IDE — را که توسعهدهندگان معمولاً نادیده میگیرند، شکار میکند. برای شما این یعنی گذار از «حدس زدن» در زمان صورتحساب به یک مدل مالی شفاف و دادهمحور در لحظهی استنتاج (Inference) — تشبیه روزمره: لحظهای که مدل واقعاً جواب تولید میکند، مثل خودِ آشپزی نه دورهی آموزش آشپز.
اما داستان امنیت کلیدهای API در این معماری حتی پیچیدهتر است — به تحلیل ما دربارهی مدیریت اسرار در محیطهای ابری مراجعه کنید.
گام بعدی شما
- داشبورد متنباز این پروژه را در haltonmeter.com بررسی کنید تا با لایسنس Apache 2.0 آن آشنا شوید.
- اگر از چندین مدل مختلف در یک پروژه استفاده میکنید، این ابزار را برای تفکیک دقیق هزینههای هر مدل تست کنید.
- بررسی کنید که چه مقدار از هزینههای شما صرف «مصارف سایه» (مانند Copilot یا Cursor) میشود.




گفتگو