تصور کنید پاسخی که هوش مصنوعی به دلیل اشتباه رد کرده است، کلید حل یک مسئلهی ریاضی باشد که سالها بدون جواب مانده بود. اگر هنوز فکر میکنید هدف از هوش مصنوعی دریافت یک پاسخ «درست» و سریع است، باید بدانید که در لبهی علم، شکستها بسیار آموزندهتر از موفقیتها هستند.
این تحول، گذار از دستیارهای عمومی به ابزارهای پژوهشی تخصصی است. عاملمحور (Agentic) — تشبیه روزمره: مثل یک تیم کاری که هر عضو تخصص خاصی دارد و یک مدیر آنها را هماهنگ میکند — رویکردی است که حالا جایگزین پرامپتهای تکمرحلهای شده است. همانطور که در تحلیل قبلی ما دربارهی ابزارهای پژوهشی گوگل فایننس اشاره کردیم، دیپمایند اکنون همین منطقِ دقتمحور را به انتزاعیترین حوزههای دانش بشری آورده است.
طبق گزارش منتشر شده در ۱۱ مه ۲۰۲۶، این سیستم بر پایهی مدل Gemini 3.1 بنا شده است. به نقل از گزارش The Rundown، معماری این ابزار دقیقاً مشابه محیطهای برنامهنویسی حرفهای است:
- یک عامل هماهنگکننده، پژوهش را به جریانهای کاری موازی تقسیم میکند.
- عاملهای فرعی متخصص، جستجوی ادبیات، تولید کد و تلاش برای اثبات را بر عهده دارند.
- چرخههای بازبینی داخلی، خروجیها را ارزیابی و غربال میکنند.

بر اساس مستندات دیپمایند، این رویکرد باعث شد نمرهی بنچمارک FrontierMath در سطح ۴ به ۴۸ درصد برسد؛ یعنی بیش از دو برابر نمرهی ۱۹ درصدی مدل Gemini 3.1 Pro در حالت عادی.

تأثیر واقعی این سیستم در دنیای واقعی ظاهر شد: مارک لاکنبی، پروفسور دانشگاه آکسفورد، توانست یک مسئلهی باز در «دفترچه کوروفکا» را حل کند. او این موفقیت را مدیون شناسایی یک «استراتژی اثبات بسیار هوشمندانه» بود که در یکی از خروجیهای «رد شده» و شکستخوردهی سیستم پنهان شده بود.

این نتیجه ثابت میکند که برای پژوهشگران، هوش مصنوعی دیگر یک جایگزین نیست، بلکه یک «همکار ریاضیدان» است که میتواند هزاران بنبست را جستجو کند تا تنها یک مسیر ممکن را بیابد. در واقع، مسیر رسیدن به جواب (Trajectory) حالا ارزشمندتر از خودِ جواب است.
گام بعدی شما
- روند تکامل بنچمارکهای استدلالی را در جدول Epoch AI دنبال کنید.
- اگر پژوهشگر هستید، به جای تمرکز بر پاسخ نهایی، «مسیرهای شکست» مدل را برای یافتن الگوهای جدید تحلیل کنید.
- بررسی کنید که چگونه گردشکارهای عاملمحور میتوانند جایگزین پرامپتهای طولانی در پروژههای شما شوند.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو