معمای ۴۲ ساله‌ای که OpenAI با یک مدل استدلالی حل کرد

اگر یک ماشین نتواند معمای ریاضی ۴۲ ساله‌ای را حل کند، آیا واقعاً می‌تواند «فکر» کند؟ باید بدانید که مرز بین شبیه‌سازی هوشمندانه و استدلال واقعی همین حالا در حال جابجایی است.

OpenAI معتقد است که استدلال ریاضی، سخت‌ترین و دقیق‌ترین معیار برای سنجش هوش مصنوعی عمومی (AGI) است؛ چرا که در ریاضیات، هیچ جایگاهی برای «تقریب» یا «توهم» وجود ندارد.

در ۲۹ آوریل ۲۰۲۶، سباستین بوبک (Sebastian Bubeck) و ارنست ریو (Ernest Ryu) جزئیاتی را منتشر کردند که نشان می‌دهد هدف نهایی، گذار از مدل‌هایی است که تنها چند دقیقه فکر می‌کنند به مدل‌هایی که می‌توانند هفته‌ها یا ماه‌ها روی یک مسئله استدلال کنند.

به نقل از گزارش the-decoder.com، این تغییر رویکرد نتایج ملموسی داشته است:

ارنست ریو، استاد سابق دانشگاه UCLA، توانست یک مسئله‌ی باز ۴۲ ساله در نظریه بهینه‌سازی (روش نستروف) را تنها در ۱۲ ساعت و با کمک ChatGPT حل کند.
مدل‌های داخلی OpenAI بیش از ۱۰ راهکار کاملاً جدید برای مسائل اردوش (Erdős problems) ارائه داده‌اند که در سطح مقالات آکادمیک هستند.
بوبک «زمان AGI» را به عنوان توانایی مدل در حفظ یک زنجیره تفکر (Chain-of-Thought) منسجم در بازه‌های زمانی طولانی تعریف می‌کند.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی گذار از چت‌بات‌ها به سمت عامل‌های هوشمند (AI Agents) اشاره کردیم، این حرکت به سوی «پژوهشگران خودکار» نشان‌دهنده چرخش استراتژیک OpenAI از ساخت ابزارهای گفتگو به سمت ساخت ابزارهای کشف علمی است.

با این حال، این پیشرفت بدون ریسک نیست. طبق اعلام بوبک، خطر «آتروفی ذهنی» یا تحلیل رفتن توانایی‌های شناختی انسان وجود دارد؛ چرا که غیرمتخصصانی که اثبات‌های تولیدشده توسط هوش مصنوعی زاینده (Generative AI) را منتشر می‌کنند، اغلب دچار خطا می‌شوند. ریو نیز همین الگو را در برنامه‌نویسی می‌بیند، جایی که نسل جدید برنامه‌نویسان در حال از دست دادن مهارت استفاده از دیباگرها هستند.

اکنون که هوش مصنوعی شروع به شناسایی خطاهای مقالات چاپ‌شده کرده است، این پرسش مطرح می‌شود: آیا دانشگاه‌ها جایگاه خود را باز می‌یابند یا جای خود را به این پژوهشگران خودکار می‌دهند؟

اما این تنها بخشی از پازل است؛ تأثیر این مدل‌ها بر بازار سخت‌افزاری و نیاز به قدرت محاسباتی عظیم را در گزارش بعدی بررسی می‌کنیم.

گام بعدی شما

اگر در حوزه‌های فنی فعالیت می‌کنید، از مدل استدلالی (Reasoning Model) برای بررسی منطق کدهای پیچیده استفاده کنید، اما هرگز بدون بازبینی انسانی آن‌ها را منتشر نکنید.
روند انتشار مقالات علمی در آرکایو (arXiv) را دنبال کنید تا ببینید چه تعداد از اثبات‌های ریاضی توسط AI تولید شده‌اند.
تفاوت بین «تولید متن» و «استدلال منطقی» را در خروجی‌های مدل‌های جدید بسنجید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

به نقل از گزارش the-decoder.com، این تغییر رویکرد نتایج ملموسی داشته است:

ارنست ریو، استاد سابق دانشگاه UCLA، توانست یک مسئله‌ی باز ۴۲ ساله در نظریه بهینه‌سازی (روش نستروف) را تنها در ۱۲ ساعت و با کمک ChatGPT حل کند.
مدل‌های داخلی OpenAI بیش از ۱۰ راهکار کاملاً جدید برای مسائل اردوش (Erdős problems) ارائه داده‌اند که در سطح مقالات آکادمیک هستند.
بوبک «زمان AGI» را به عنوان توانایی مدل در حفظ یک زنجیره تفکر (Chain-of-Thought) منسجم در بازه‌های زمانی طولانی تعریف می‌کند.

گام بعدی شما

اگر در حوزه‌های فنی فعالیت می‌کنید، از مدل استدلالی (Reasoning Model) برای بررسی منطق کدهای پیچیده استفاده کنید، اما هرگز بدون بازبینی انسانی آن‌ها را منتشر نکنید.
روند انتشار مقالات علمی در آرکایو (arXiv) را دنبال کنید تا ببینید چه تعداد از اثبات‌های ریاضی توسط AI تولید شده‌اند.
تفاوت بین «تولید متن» و «استدلال منطقی» را در خروجی‌های مدل‌های جدید بسنجید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

معمای ۴۲ ساله‌ای که OpenAI با یک مدل استدلالی حل کرد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

معمای ۴۲ ساله‌ای که OpenAI با یک مدل استدلالی حل کرد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

معمای ۴۲ ساله‌ای که OpenAI با یک مدل استدلالی حل کرد

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

معمای ۴۲ ساله‌ای که OpenAI با یک مدل استدلالی حل کرد

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران