شکاف پنهان در مذاکرات هوش مصنوعی: وقتی عامل‌ها مخفیانه می‌بازند

تصور کنید عامل هوش مصنوعی شما در حال بستن قراردادهایی است که شما را ضرر می‌دهد، اما شما هرگز متوجه نمی‌شوید. این کابوس اکنون به یک واقعیت اثبات‌شده تبدیل شده است.

به گزارش TechCrunch در ۲۵ آوریل ۲۰۲۶، شرکت Anthropic نتایج تکان‌دهنده‌ای از یک آزمایش داخلی به نام «پروژه डील» (Project Deal) منتشر کرد. در این تجربه، ۶۹ کارمند این شرکت با بودجه‌ی ۱۰۰ دلاری، عامل‌های (Agents) خود را برای خرید و فروش کالاهای واقعی به میدان فرستادند.

نتایج این رقابت در دفتر سان‌فرانسیسکو به شرح زیر است:

تعداد کل معاملات موفق: ۱۸۶ مورد
ارزش کل معاملات: بیش از ۴,۰۰۰ دلار
ساختار آزمایش: ۴ بازار مجزا (یک بازار واقعی و ۳ بازار آزمایشی)

بر اساس مستندات این پروژه، یک عدم تقارن خطرناک آشکار شد: کاربرانی که از مدل‌های پیشرفته‌تر استفاده می‌کردند، سود بیشتری بردند، اما طرف‌های مقابل (که مدل‌های ضعیف‌تری داشتند) هرگز متوجه این اختلاف کیفیت نشدند. این یافته در راستای گزارش «پایان دوران چانه‌زنی» است که در آن نشان دادیم عامل‌های کلود چگونه در یک آزمایش تجاری پنهان، انسان‌ها را به‌شدت مغبون کردند.

همان‌طور که در تحلیل قبلی ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، این اتفاق نشان می‌دهد که تجارت عامل‌محور (Agentic) از تئوری به واقعیت رسیده است. اما نکته‌ی تکان‌دهنده این است که دستورالعمل‌های اولیه یا همان مهندسی پرامپت (Prompt Engineering) تأثیری در قیمت نهایی یا احتمال فروش نداشت.

این یعنی شکاف توانمندی در «وزن‌های مدل» (Model Weights) نهفته است، نه در کلمات ما. اگر قصد دارید از هوش مصنوعی زاینده (Generative AI) برای مدیریت فروش یا تامین کالا استفاده کنید، باید بدانید که صرفاً توصیه به «منصف بودن» به شما سود نمی‌رساند.

تحقیقات کوین تروی و دیلان شیلدز و همکارانشان در Anthropic هشدار می‌دهد که در اقتصادهای چند-عامله، بازنده هرگز نمی‌فهمد که بازنده است.

اما این تنها بخشی از معمای بزرگتر است؛ تأثیر این شکاف بر امنیت مالی در گزارش بعدی ما بررسی خواهد شد.

گام بعدی شما

پیش از سپردن مذاکرات مالی به AI، مدل‌های مختلف را در محیط‌های شبیه‌سازی شده مقایسه کنید.
به جای تکیه بر پرامپت‌های اخلاقی، بر روی انتخاب مدل با وزن‌های بهینه‌تر تمرکز کنید.
سیستمی برای ممیزی (Audit) نتایج خروجی عامل‌ها طراحی کنید تا متوجه «شکاف کیفیت» شوید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

نتایج این رقابت در دفتر سان‌فرانسیسکو به شرح زیر است:

تعداد کل معاملات موفق: ۱۸۶ مورد
ارزش کل معاملات: بیش از ۴,۰۰۰ دلار
ساختار آزمایش: ۴ بازار مجزا (یک بازار واقعی و ۳ بازار آزمایشی)

اما این تنها بخشی از معمای بزرگتر است؛ تأثیر این شکاف بر امنیت مالی در گزارش بعدی ما بررسی خواهد شد.

گام بعدی شما

پیش از سپردن مذاکرات مالی به AI، مدل‌های مختلف را در محیط‌های شبیه‌سازی شده مقایسه کنید.
به جای تکیه بر پرامپت‌های اخلاقی، بر روی انتخاب مدل با وزن‌های بهینه‌تر تمرکز کنید.
سیستمی برای ممیزی (Audit) نتایج خروجی عامل‌ها طراحی کنید تا متوجه «شکاف کیفیت» شوید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

شکاف پنهان در مذاکرات هوش مصنوعی: وقتی عامل‌ها مخفیانه می‌بازند

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

شکاف پنهان در مذاکرات هوش مصنوعی: وقتی عامل‌ها مخفیانه می‌بازند

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

شکاف پنهان در مذاکرات هوش مصنوعی: وقتی عامل‌ها مخفیانه می‌بازند

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

شکاف پنهان در مذاکرات هوش مصنوعی: وقتی عامل‌ها مخفیانه می‌بازند

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران