گورز: ChatGPT 5.5 Pro با ایده‌های بدیع، مسائل باز نظریه اعداد را حل کرد

تصور کنید سخت‌ترین مسائل نظریه اعداد، که سال‌ها ذهن ریاضیدانان را به خود مشغول کرده بود، در کمتر از دو ساعت توسط یک مدل زبانی حل شوند. اگر هنوز تصور می‌کنید هوش مصنوعی فقط یک ماشین بازنویسی است، باید بدانید که مرز بین «دستیار» و «پژوهشگر» همین حالا شکسته شده است.

این تحول در حالی رخ می‌دهد که دنیای ریاضیات به سمت «ریاضیات در مقیاس صنعتی» حرکت می‌کند. برای درک این اتفاق، باید ابتدا با مدل زبانی بزرگ (LLM) — تشبیه روزمره: مثل کتابخانه‌داری که میلیارد‌ها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — آشنا شویم. همان‌طور که در تحلیل قبلی ما درباره‌ی موفقیت مدل‌های زبانی در ترکیبیات اشاره کردیم، این ابزارها در حال عبور از مرحله‌ی حدس‌زنی به مرحله‌ی استدلال دقیق هستند.

به نقل از تیموتی گورز (Timothy Gowers)، استاد کالج دو فرانس و برنده مدال فیلدز، مدل ChatGPT 5.5 Pro در ۹ مه ۲۰۲۶ توانست بدون هیچ راهنمایی انسانی، پژوهش‌های ریاضی در سطح دکترا تولید کند. طبق گزارش او، نتایج به‌دست‌آمده از مسائل مطرح شده توسط مل ناتانسون (Mel Nathanson) تکان‌دهنده بود:

سرعت خیره‌کننده: مدل تنها در ۱۷ دقیقه و ۵ ثانیه توانست یک کران نمایی را به یک کران درجه دوم بهبود ببخشد.
خلاقیت ساختاری: آیزاک راجاگوپال (Isaac Rajagopal)، دانشجوی MIT، روش مدل برای فشرده‌سازی ساختارهای جبری را «بسیار نبوغ‌آمیز» و «کاملاً بدیع» توصیف کرد.
بهره‌وری عملیاتی: مدل در ۳۱ دقیقه یک کران نمایی دیگر را به کران چندجمله‌ای تبدیل کرد و در کمتر از ۳ دقیقه، پیش‌نویس کامل مقاله را با فرمت LaTeX تولید نمود.

این قابلیت، ارزش یک مدرک دکترا در ریاضیات را به‌طور بنیادین تغییر می‌دهد. وقتی یک مدل می‌تواند نقاط ضعف یک مقاله را شناسایی کرده و تکنیک‌ها را به‌طور خودکار تطبیق دهد، نقش انسان از «حل‌کننده» به «ارکستراتور» و «تأییدکننده» تغییر می‌کند. دوران «پژوهشگر گرگ تنها» به پایان رسیده و جای خود را به مدل‌های ترکیبی می‌دهد که در آن مهارت اصلی، هدایت هوش مصنوعی در فضاهای صوری پیچیده است.

با این حال، مسیر رسیدن به استقلال کامل هنوز ناهموار است. به گزارش منابع متعدد، سیستم Aletheia متعلق به گوگل دیپ‌مایند، با وجود توانایی در رد مفروضات قدیمی، در تست ۷۰۰ مسئله باز ریاضی تنها ۶.۵٪ نرخ پاسخ قابل‌استفاده داشت.

گام بعدی شما

پیش‌نویس‌های گورز را پس از انتشار عمومی دنبال کنید تا ببینید آیا این ایده‌های «بدیع» در برابر داوری سخت‌گیرانه همتاها (Peer Review) دوام می‌آورند یا خیر.
اگر پژوهشگر هستید، جریان کاری خود را از «جست‌وجوی پاسخ» به «طراحی استراتژی برای مدل» تغییر دهید.
تفاوت بین مدل‌های استدلالی و مدل‌های پیش‌بینی‌کننده را در پروژه‌های کوچک تست کنید.

اما این موفقیت در برابر شکست‌های سیستم Aletheia گوگل چه معنایی دارد؟ به تحلیل ما درباره‌ی آینده مدل‌های استدلالی مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

سرعت خیره‌کننده: مدل تنها در ۱۷ دقیقه و ۵ ثانیه توانست یک کران نمایی را به یک کران درجه دوم بهبود ببخشد.
خلاقیت ساختاری: آیزاک راجاگوپال (Isaac Rajagopal)، دانشجوی MIT، روش مدل برای فشرده‌سازی ساختارهای جبری را «بسیار نبوغ‌آمیز» و «کاملاً بدیع» توصیف کرد.
بهره‌وری عملیاتی: مدل در ۳۱ دقیقه یک کران نمایی دیگر را به کران چندجمله‌ای تبدیل کرد و در کمتر از ۳ دقیقه، پیش‌نویس کامل مقاله را با فرمت LaTeX تولید نمود.

گام بعدی شما

پیش‌نویس‌های گورز را پس از انتشار عمومی دنبال کنید تا ببینید آیا این ایده‌های «بدیع» در برابر داوری سخت‌گیرانه همتاها (Peer Review) دوام می‌آورند یا خیر.
اگر پژوهشگر هستید، جریان کاری خود را از «جست‌وجوی پاسخ» به «طراحی استراتژی برای مدل» تغییر دهید.
تفاوت بین مدل‌های استدلالی و مدل‌های پیش‌بینی‌کننده را در پروژه‌های کوچک تست کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گورز: ChatGPT 5.5 Pro با ایده‌های بدیع، مسائل باز نظریه اعداد را حل کرد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گورز: ChatGPT 5.5 Pro با ایده‌های بدیع، مسائل باز نظریه اعداد را حل کرد

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گورز: ChatGPT 5.5 Pro با ایده‌های بدیع، مسائل باز نظریه اعداد را حل کرد

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

گورز: ChatGPT 5.5 Pro با ایده‌های بدیع، مسائل باز نظریه اعداد را حل کرد

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران