تصور کنید سختترین مسائل نظریه اعداد، که سالها ذهن ریاضیدانان را به خود مشغول کرده بود، در کمتر از دو ساعت توسط یک مدل زبانی حل شوند. اگر هنوز تصور میکنید هوش مصنوعی فقط یک ماشین بازنویسی است، باید بدانید که مرز بین «دستیار» و «پژوهشگر» همین حالا شکسته شده است.
این تحول در حالی رخ میدهد که دنیای ریاضیات به سمت «ریاضیات در مقیاس صنعتی» حرکت میکند. برای درک این اتفاق، باید ابتدا با مدل زبانی بزرگ (LLM) — تشبیه روزمره: مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — آشنا شویم. همانطور که در تحلیل قبلی ما دربارهی موفقیت مدلهای زبانی در ترکیبیات اشاره کردیم، این ابزارها در حال عبور از مرحلهی حدسزنی به مرحلهی استدلال دقیق هستند.
به نقل از تیموتی گورز (Timothy Gowers)، استاد کالج دو فرانس و برنده مدال فیلدز، مدل ChatGPT 5.5 Pro در ۹ مه ۲۰۲۶ توانست بدون هیچ راهنمایی انسانی، پژوهشهای ریاضی در سطح دکترا تولید کند. طبق گزارش او، نتایج بهدستآمده از مسائل مطرح شده توسط مل ناتانسون (Mel Nathanson) تکاندهنده بود:
- سرعت خیرهکننده: مدل تنها در ۱۷ دقیقه و ۵ ثانیه توانست یک کران نمایی را به یک کران درجه دوم بهبود ببخشد.
- خلاقیت ساختاری: آیزاک راجاگوپال (Isaac Rajagopal)، دانشجوی MIT، روش مدل برای فشردهسازی ساختارهای جبری را «بسیار نبوغآمیز» و «کاملاً بدیع» توصیف کرد.
- بهرهوری عملیاتی: مدل در ۳۱ دقیقه یک کران نمایی دیگر را به کران چندجملهای تبدیل کرد و در کمتر از ۳ دقیقه، پیشنویس کامل مقاله را با فرمت LaTeX تولید نمود.
این قابلیت، ارزش یک مدرک دکترا در ریاضیات را بهطور بنیادین تغییر میدهد. وقتی یک مدل میتواند نقاط ضعف یک مقاله را شناسایی کرده و تکنیکها را بهطور خودکار تطبیق دهد، نقش انسان از «حلکننده» به «ارکستراتور» و «تأییدکننده» تغییر میکند. دوران «پژوهشگر گرگ تنها» به پایان رسیده و جای خود را به مدلهای ترکیبی میدهد که در آن مهارت اصلی، هدایت هوش مصنوعی در فضاهای صوری پیچیده است.
با این حال، مسیر رسیدن به استقلال کامل هنوز ناهموار است. به گزارش منابع متعدد، سیستم Aletheia متعلق به گوگل دیپمایند، با وجود توانایی در رد مفروضات قدیمی، در تست ۷۰۰ مسئله باز ریاضی تنها ۶.۵٪ نرخ پاسخ قابلاستفاده داشت.
گام بعدی شما
- پیشنویسهای گورز را پس از انتشار عمومی دنبال کنید تا ببینید آیا این ایدههای «بدیع» در برابر داوری سختگیرانه همتاها (Peer Review) دوام میآورند یا خیر.
- اگر پژوهشگر هستید، جریان کاری خود را از «جستوجوی پاسخ» به «طراحی استراتژی برای مدل» تغییر دهید.
- تفاوت بین مدلهای استدلالی و مدلهای پیشبینیکننده را در پروژههای کوچک تست کنید.
اما این موفقیت در برابر شکستهای سیستم Aletheia گوگل چه معنایی دارد؟ به تحلیل ما دربارهی آینده مدلهای استدلالی مراجعه کنید.
گفتگو