تصور کنید در یک معامله صدها دلار ضرر کنید، اما با لبخند از آن خارج شوید. این کابوسِ پنهانِ واگذاری مدیریت مالی به عاملهای هوش مصنوعی (AI Agents) است.
در دسامبر ۲۰۲۵، شرکت Anthropic آزمایشی به نام «پروژه دیل» (Project Deal) را اجرا کرد که در آن مدلهای هوش مصنوعی زاینده (Generative AI) مسئولیت کامل یک بازار خرید و فروش داخلی را بر عهده داشتند. به نقل از the-decoder.com، این آزمایش برای ۶۹ کارمند در دفتر سانفرانسیسکو طراحی شد و تمام مراحل مذاکره، از نوشتن آگهی تا چانهزنی بر سر قیمت، از طریق Slack توسط عاملها مدیریت شد. انسانها تنها در مرحلهی نهایی برای تبادل فیزیکی کالاها، مانند اسنوبرد یا توپ پینگپنگ، وارد عمل شدند.

طبق اعلام Anthropic، شکاف عملکردی میان لایههای مختلف مدلها در این محیط تجاری بسیار شدید بود. در اجرای موازی، عملکرد مدل پیشرو یعنی Claude Opus 4.5 با کوچکترین مدل یعنی Claude Haiku 4.5 مقایسه شد و نتایج تکاندهنده بود:
- برتری قیمتی: در ۱۶۱ مورد، فروشندگان با مدل Opus بهطور متوسط ۲.۶۸ دلار بیشتر کسب کردند، در حالی که خریداران این مدل ۲.۴۵ دلار کمتر از کاربران Haiku پرداخت کردند.
- تفاوتهای شدید: یک یاقوت آزمایشگاهی توسط عامل Opus به قیمت ۶۵ دلار فروخته شد، اما همان کالا توسط عامل Haiku تنها ۳۵ دلار به فروش رسید.
- شکست در مذاکره: در حالی که عاملهای Opus قیمتها را از طریق پیشنهادهای رقابتی بالا میبردند، عاملهای Haiku بهراحتی توسط طرف مقابل «سرباز» میشدند و قیمتهای پایینتری میپذیرفتند.
همانطور که در تحلیل قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، شکاف بین توانایی مدلها و درک کاربر همواره یک نقطهی ضعف است. در این آزمایش نیز، شرکتکنندگان از ضررهای مالی خود کاملاً بیخبر بودند. کاربران Haiku منصفانه بودن معاملات خود را ۴.۰۶ از ۷ رتبهبندی کردند که تقریباً با رتبهی ۴.۰۵ کاربران Opus برابر بود. این یعنی ما در حال واگذاری قدرت مالی به سیستمهایی هستیم که حتی نمیتوانیم بفهمیم چه زمانی توسط یک مدل برتر شکست خوردهایم.
این ریسک سیستمیک نشان میدهد که چارچوبهای قانونی و سیاستی برای تجارتهای عاملمحور (Agentic) هنوز وجود ندارند. Anthropic هشدار میدهد که در محیطهای شرکتی، این دینامیک میتواند نابرابریهای اقتصادی را تشدید کند یا آسیبپذیریهای جدیدی در برابر حملات تزریق پرامپت (Prompt Injection) ایجاد کند.
اما این ریسکهای مالی تنها بخشی از ماجراست؛ تأثیر این مدلها بر بازارهای بورس و معاملات سریع را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- برای وظایف حساس مالی، هرگز به مدلهای کوچک (SLM) اکتفا نکنید و از مدلهای پیشرو استفاده کنید.
- سیستمی برای نظارت انسانی (Human-in-the-loop) در مراحل نهایی تایید قیمت طراحی کنید.
- معیارهای «رضایت کاربر» را با «نتایج واقعی دادهمحور» مقایسه کنید تا تلهی رضایت را شناسایی کنید.




گفتگو