اگر امروز در حال استقرار عاملهای هوش مصنوعی هستید، باید با یک واقعیت تلخ روبرو شوید: اکثر این پروژهها هیچ سود مالی واقعی تولید نمیکنند. تصور کنید ماهها بودجه صرف ساخت سیستمی کنید که در نهایت هیچ تأثیری بر تراز مالی شرکت شما نداشته باشد.
به نقل از دانشگاه MIT، در سال ۲۰۲۵ مشخص شد که ۹۵٪ از پروژههای آزمایشی هوش مصنوعی زاینده (Generative AI) در سازمانها، هیچ اثر قابلاندازهگیری بر سود و زیان (P&L) نداشتند. این شکاف به این دلیل ایجاد شده که کسبوکارها یک چتبات هوشمند را با یک عامل (Agent) — سیستمی که بتواند بهطور مستقل هدف را دنبال کند — اشتباه میگیرند.
همانطور که در تحلیل قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، فاصله بین یک دموی جذاب و یک محصول پایدار بسیار زیاد است. در دنیای واقعی، مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — وقتی با محیط عملیاتی مواجه میشود، دچار «بدهی متنی» و اتصالات شکننده به APIها میشود.
طبق گزارش Gartner، پیشبینی میشود بیش از ۴۰٪ از پروژههای عاملمحور تا سال ۲۰۲۷ لغو شوند. در یک شبیهسازی توسط دانشگاه کارنگی ملون، نتایج تکاندهنده بود:
- مدل Claude 3.5 Sonnet تنها ۲۴٪ از کارهای اداری واقعی را به پایان رساند.
- مدل GPT-4o تنها به نرخ ۸.۶٪ موفقیت رسید.
این شکستها اغلب از «آلودگی متنی» (تزریق دادههای نامرتبط) یا «تورم ابزار» ناشی میشوند؛ یعنی وقتی بیش از ۱۰ ابزار به مدل میدهید، عملکرد آن بهجای بهبود، افت میکند. برای حل این مشکل، شرکت Afiniti Global معماری چهارلایه را پیشنهاد میدهد: برنامهریزی، ابزارها، ارزیابی و عملیات.

این تغییر مسیر ثابت میکند که کیفیت مدل دیگر گلوگاه اصلی نیست. چالش واقعی اکنون «مهندسی متن» است. شما نمیتوانید اتصالات شکننده را با استفاده از یک مدل بزرگتر حل کنید؛ بلکه راهکار در I/O رویدادمحور و مشاهدهپذیری سختگیرانه است. برای کاربر، این یعنی بازگشت سرمایه (ROI) به «لولهکشی» سیستم وابسته است، نه به انتخاب مدل.
گام بعدی شما
- محرکهای «انسان در حلقه» (Human-in-the-loop) را برای کارهای حساس مثل انتقال وجه بازبینی کنید.
- بررسی کنید که آیا APIهای شما «همتوان» (Idempotent) هستند یا خیر تا از هزینههای تکراری استنتاج جلوگیری شود.
- معماری خود را از حالت تکلایه به ساختار چهارلایه (برنامهریزی $\rightarrow$ ابزار $\rightarrow$ ارزیابی $\rightarrow$ عملیات) منتقل کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو