باید بدانید که ممکن است در هر معاملهای که با کمک هوش مصنوعی انجام میدهید، پولی را از دست بدهید بدون اینکه حتی متوجه شوید. این دیگر یک هشدار نیست، بلکه نتیجهی یک آزمایش واقعی است.
به نقل از گزارش منتشر شده توسط آنتروپیک (Anthropic) در ۲۴ آوریل ۲۰۲۴، نتایج پروژه دیل (Project Deal) نشان میدهد که عاملهای (Agents) خودگردان کلود (Claude) توانستهاند در یک بازار واقعی، انسانها را در مذاکرات تجاری شکست دهند. این آزمایش که بر پایه هوش مصنوعی زاینده (Generative AI) طراحی شده بود، ثابت کرد که قدرت مدل مستقیماً بر میزان سود مالی تأثیر میگذارد.
در این تجربه، ۶۹ کارمند در سانفرانسیسکو بودجه ۱۰۰ دلاری دریافت کردند و عاملهای کلود به مدت یک هفته در کانالهای اسلک (Slack) به خرید و فروش کالاهای واقعی پرداختند. طبق گزارش unite.ai، جزئیات تکاندهندهای در این آزمایش دیده شد:
- کلود اپوس ۴.۵ (Claude Opus 4.5) به عنوان فروشنده، بهطور میانگین ۲.۶۸ دلار بیشتر برای هر کالا دریافت کرد.
- خریداران با مدل اپوس، ۲.۴۵ دلار کمتر پرداخت کردند.
- یک دوچرخه تاشدهی خراب، تحت مدیریت مدل اپوس ۶۵ دلار فروخته شد، در حالی که با مدل کلود هایکو ۴.۵ (Claude Haiku 4.5) تنها ۳۸ دلار قیمت داشت.
همانطور که در تحلیل قبلی ما دربارهی پیشروی کلود در مدیریت وظایف خودگردان اشاره کردیم، این پروژه نشان میدهد که آنتروپیک بهطور فعال در حال بررسی تجارتهای عاملمحور (Agentic) است. نکتهی تکاندهنده این است که کاربران هیچ تفاوتی در «منصفانه بودن» معامله حس نکردند؛ یعنی تفاوت قیمت شدید بین مدلهای قدرتمند و ضعیف، برای انسانها کاملاً نامرئی بود.
بر اساس مستندات این پروژه، استراتژیهای مهندسی پرامپت تأثیر کمی داشتند و عامل اصلی موفقیت، صرفاً انتخاب مدل قدرتمندتر بود. این موضوع سه هشدار جدی را به همراه دارد: احتمال سوءاستفاده از انگیزههای شرکتی، ریسک حملات تزریق پرامپت در بازارهای الگوریتمی و نبود هرگونه چارچوب قانونی برای مدلهایی که از طرف ما معامله میکنند.
این تنها آغاز ماجراست؛ اثر موجگونهی این تصمیم بر اکوسیستم متنباز را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- بررسی تفاوتهای عملکردی مدلهای مختلف در مذاکرات پیچیده برای جلوگیری از ضررهای مالی.
- دنبال کردن قوانین جدید مربوط به شفافیت در تجارتهای عاملمحور.
- آزمایش ابزارهای اتوماسیون برای بهینهسازی قیمتها در کسبوکارهای کوچک.




گفتگو