اگر یک ماشین نتواند معمای ریاضی ۴۲ سالهای را حل کند، آیا واقعاً میتواند «فکر» کند؟ باید بدانید که مرز بین شبیهسازی هوشمندانه و استدلال واقعی همین حالا در حال جابجایی است.
OpenAI معتقد است که استدلال ریاضی، سختترین و دقیقترین معیار برای سنجش هوش مصنوعی عمومی (AGI) است؛ چرا که در ریاضیات، هیچ جایگاهی برای «تقریب» یا «توهم» وجود ندارد.
در ۲۹ آوریل ۲۰۲۶، سباستین بوبک (Sebastian Bubeck) و ارنست ریو (Ernest Ryu) جزئیاتی را منتشر کردند که نشان میدهد هدف نهایی، گذار از مدلهایی است که تنها چند دقیقه فکر میکنند به مدلهایی که میتوانند هفتهها یا ماهها روی یک مسئله استدلال کنند.
به نقل از گزارش the-decoder.com، این تغییر رویکرد نتایج ملموسی داشته است:
- ارنست ریو، استاد سابق دانشگاه UCLA، توانست یک مسئلهی باز ۴۲ ساله در نظریه بهینهسازی (روش نستروف) را تنها در ۱۲ ساعت و با کمک ChatGPT حل کند.
- مدلهای داخلی OpenAI بیش از ۱۰ راهکار کاملاً جدید برای مسائل اردوش (Erdős problems) ارائه دادهاند که در سطح مقالات آکادمیک هستند.
- بوبک «زمان AGI» را به عنوان توانایی مدل در حفظ یک زنجیره تفکر (Chain-of-Thought) منسجم در بازههای زمانی طولانی تعریف میکند.
همانطور که در تحلیلهای پیشین ما دربارهی گذار از چتباتها به سمت عاملهای هوشمند (AI Agents) اشاره کردیم، این حرکت به سوی «پژوهشگران خودکار» نشاندهنده چرخش استراتژیک OpenAI از ساخت ابزارهای گفتگو به سمت ساخت ابزارهای کشف علمی است.
با این حال، این پیشرفت بدون ریسک نیست. طبق اعلام بوبک، خطر «آتروفی ذهنی» یا تحلیل رفتن تواناییهای شناختی انسان وجود دارد؛ چرا که غیرمتخصصانی که اثباتهای تولیدشده توسط هوش مصنوعی زاینده (Generative AI) را منتشر میکنند، اغلب دچار خطا میشوند. ریو نیز همین الگو را در برنامهنویسی میبیند، جایی که نسل جدید برنامهنویسان در حال از دست دادن مهارت استفاده از دیباگرها هستند.
اکنون که هوش مصنوعی شروع به شناسایی خطاهای مقالات چاپشده کرده است، این پرسش مطرح میشود: آیا دانشگاهها جایگاه خود را باز مییابند یا جای خود را به این پژوهشگران خودکار میدهند؟
اما این تنها بخشی از پازل است؛ تأثیر این مدلها بر بازار سختافزاری و نیاز به قدرت محاسباتی عظیم را در گزارش بعدی بررسی میکنیم.
گام بعدی شما
- اگر در حوزههای فنی فعالیت میکنید، از مدل استدلالی (Reasoning Model) برای بررسی منطق کدهای پیچیده استفاده کنید، اما هرگز بدون بازبینی انسانی آنها را منتشر نکنید.
- روند انتشار مقالات علمی در آرکایو (arXiv) را دنبال کنید تا ببینید چه تعداد از اثباتهای ریاضی توسط AI تولید شدهاند.
- تفاوت بین «تولید متن» و «استدلال منطقی» را در خروجیهای مدلهای جدید بسنجید.




گفتگو