گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

اگر امروز در حال استقرار عامل‌های هوش مصنوعی هستید، باید با یک واقعیت تلخ روبرو شوید: اکثر این پروژه‌ها هیچ سود مالی واقعی تولید نمی‌کنند. تصور کنید ماه‌ها بودجه صرف ساخت سیستمی کنید که در نهایت هیچ تأثیری بر تراز مالی شرکت شما نداشته باشد.

به نقل از دانشگاه MIT، در سال ۲۰۲۵ مشخص شد که ۹۵٪ از پروژه‌های آزمایشی هوش مصنوعی زاینده (Generative AI) در سازمان‌ها، هیچ اثر قابل‌اندازه‌گیری بر سود و زیان (P&L) نداشتند. این شکاف به این دلیل ایجاد شده که کسب‌وکارها یک چت‌بات هوشمند را با یک عامل (Agent) — سیستمی که بتواند به‌طور مستقل هدف را دنبال کند — اشتباه می‌گیرند.

همان‌طور که در تحلیل قبلی ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، فاصله بین یک دموی جذاب و یک محصول پایدار بسیار زیاد است. در دنیای واقعی، مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — وقتی با محیط عملیاتی مواجه می‌شود، دچار «بدهی متنی» و اتصالات شکننده به APIها می‌شود.

طبق گزارش Gartner، پیش‌بینی می‌شود بیش از ۴۰٪ از پروژه‌های عامل‌محور تا سال ۲۰۲۷ لغو شوند. در یک شبیه‌سازی توسط دانشگاه کارنگی ملون، نتایج تکان‌دهنده بود:

مدل Claude 3.5 Sonnet تنها ۲۴٪ از کارهای اداری واقعی را به پایان رساند.
مدل GPT-4o تنها به نرخ ۸.۶٪ موفقیت رسید.

این شکست‌ها اغلب از «آلودگی متنی» (تزریق داده‌های نامرتبط) یا «تورم ابزار» ناشی می‌شوند؛ یعنی وقتی بیش از ۱۰ ابزار به مدل می‌دهید، عملکرد آن به‌جای بهبود، افت می‌کند. برای حل این مشکل، شرکت Afiniti Global معماری چهارلایه را پیشنهاد می‌دهد: برنامه‌ریزی، ابزارها، ارزیابی و عملیات.

Cover image for Why AI Agents Fail?

این تغییر مسیر ثابت می‌کند که کیفیت مدل دیگر گلوگاه اصلی نیست. چالش واقعی اکنون «مهندسی متن» است. شما نمی‌توانید اتصالات شکننده را با استفاده از یک مدل بزرگ‌تر حل کنید؛ بلکه راهکار در I/O رویدادمحور و مشاهده‌پذیری سخت‌گیرانه است. برای کاربر، این یعنی بازگشت سرمایه (ROI) به «لوله‌کشی» سیستم وابسته است، نه به انتخاب مدل.

گام بعدی شما

محرک‌های «انسان در حلقه» (Human-in-the-loop) را برای کارهای حساس مثل انتقال وجه بازبینی کنید.
بررسی کنید که آیا APIهای شما «هم‌توان» (Idempotent) هستند یا خیر تا از هزینه‌های تکراری استنتاج جلوگیری شود.
معماری خود را از حالت تک‌لایه به ساختار چهارلایه (برنامه‌ریزی $\rightarrow$ ابزار $\rightarrow$ ارزیابی $\rightarrow$ عملیات) منتقل کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مدل Claude 3.5 Sonnet تنها ۲۴٪ از کارهای اداری واقعی را به پایان رساند.
مدل GPT-4o تنها به نرخ ۸.۶٪ موفقیت رسید.

Cover image for Why AI Agents Fail?

گام بعدی شما

محرک‌های «انسان در حلقه» (Human-in-the-loop) را برای کارهای حساس مثل انتقال وجه بازبینی کنید.
بررسی کنید که آیا APIهای شما «هم‌توان» (Idempotent) هستند یا خیر تا از هزینه‌های تکراری استنتاج جلوگیری شود.
معماری خود را از حالت تک‌لایه به ساختار چهارلایه (برنامه‌ریزی $\rightarrow$ ابزار $\rightarrow$ ارزیابی $\rightarrow$ عملیات) منتقل کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گزارش MIT: ۹۵٪ از پیلوت‌های هوش مصنوعی سازمانی شکست مالی خورده‌اند

گام بعدی شما

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران