تصور کنید در شرکتی کار میکنید که موفقیت شما نه با کیفیت کدی که مینویسید، بلکه با مقدار «توکنهای» مصرفشده سنجیده میشود. اگر هنوز فکر میکنید پذیرش گستردهی ابزارهای هوش مصنوعی به معنای افزایش بهرهوری است، باید بدانید که در غیاب معیارهای درست، این ابزارها تنها به ابزاری برای فریب مدیران تبدیل میشوند.
این وضعیت در آمازون (Amazon) به دلیل یک دستور سازمانی شکل گرفته است: بیش از ۸۰ درصد توسعهدهندگان باید بهصورت هفتگی از هوش مصنوعی استفاده کنند. در چنین محیطی، کارکنان از مدل زبانی بزرگ (LLM) — تشبیه روزمره: مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — نه برای حل مسائل پیچیده، بلکه برای بالا بردن رتبه خود در جدولهای داخلی استفاده میکنند. همانطور که در تحلیلهای پیشین ما دربارهی معیارهای سنجش اثرگذاری AI اشاره کردیم، تبدیل یک معیار (Metric) به هدف، معمولاً منجر به تخریب همان معیار میشود.
به گزارش فایننشال تایمز (Financial Times) در ۱۲ مه ۲۰۲۶، توسعهدهندگان آمازون به پدیدهای به نام «توکنمکسینگ» روی آوردهاند. آنها از توکن (Token) — تشبیه روزمره: تکههای کوچکی از متن — مثل برشهای یک کیک طولانی که مدل تکهتکه میخورد — در مقیاس وسیع استفاده میکنند تا «پیشرو در AI» به نظر برسند. ابزار اصلی این بازی، پلتفرم داخلی مشکلاو (MeshClaw) است که به کارکنان اجازه میدهد عامل (Agent) — تشبیه روزمره: مثل یک دستیار دیجیتال که نه فقط حرف میزند، بلکه میتواند کارهای واقعی مثل ارسال ایمیل را انجام دهد — بسازند تا کارهای بیهودهای مثل دستهبندی ایمیلهای تکراری یا تعاملات بیهدف در Slack را بهطور خودکار انجام دهند.
بر اساس بررسی منابع متعدد، این رفتار مشابه الگوهایی است که در کارکنان متا (Meta) نیز دیده شده است. اگرچه آمازون ادعا میکند این اعداد در ارزیابیهای عملکردی تأثیری ندارند، اما تحلیلگران داخلی میگویند مدیران بهشدت این جدولها را رصد میکنند. این یعنی هدف از دست رفته و جای آن را «بیشترین میزان استنتاج (Inference)» — تشبیه روزمره: لحظهای که مدل واقعاً جواب تولید میکند — مثل خودِ آشپزی، نه دورهی آموزش آشپز — گرفته است.
این وضعیت دقیقاً همان «اثر کبرا» (Cobra Effect) در حاکمیت هوش مصنوعی است: وقتی یک معیار غلط به هدف تبدیل شود، دیگر آن معیار کارایی ندارد. برای هر مدیری، این یک هشدار است؛ اندازهگیری «فعالیت» (تعداد توکنها) به جای «نتیجه» (کدهای تحویل داده شده یا کاهش باگها)، بهجای کارایی، اتلاف منابع را تشویق میکند.
گام بعدی شما
- اگر مدیر هستید، معیارهای KPI خود را از «میزان استفاده» به «کیفیت خروجی» تغییر دهید.
- به دنبال ابزارهای سنجش بهرهوری بگردید که چرخه زمان (Cycle Time) را رصد میکنند، نه حجم مصرف API.
- بررسی کنید آیا تیم شما در حال اتوماسیون کارهای بیهوده برای رسیدن به اهداف عددی است یا خیر.
اما چالشهای عمیقتر در اندازهگیری اثر واقعی AI را در گزارش Frontier Radar بررسی کنید.




گفتگو