باید بدانید که مرز بین شهود ریاضی دانشمندان و توان محاسباتی ماشینها همین حالا جابهجا شده است. تصور کنید مدلی که تا دیروز فقط پاسخهای موجود را بازیافت میکرد، اکنون ایدههایی بدیع برای حل مسائل سطح دکترا خلق میکند.
این تحول در حالی رخ میدهد که صنعت به سمت مدلهای عاملمحور (Agentic) و متمرکز بر استدلال حرکت میکند. این رویکرد استدلالی با تکنیکهای پیشرفتهای مانند مسیریابی مبتنی بر اختلاف تقویت شده است تا دقت مدلها در حل مسائل پیچیده ریاضی به طور چشمگیری افزایش یابد. همانطور که در تحلیل قبلی ما دربارهی تواناییهای سیستمی GPT-5.5-Cyber اشاره کردیم، تمرکز اکنون بر «تفکر سیستم ۲» در علوم انتزاعی است. برای جامعهی فنی، این بدان معناست که مرز بین شهود انسانی و محاسبات ماشین در حوزههایی که پیشتر «ضد-هوش مصنوعی» پنداشته میشدند، در حال محو شدن است.
طبق گزارش ریاضیدان تیم گاورز که در ۹ مه ۲۰۲۶ منتشر شد، این مدل با مسئلهای در نظریه اعداد جمعی (Additive Number Theory) دربارهی قطر مجموعههایی با اندازهی مجموع-مجموعه (Sumset) مشخص دستوپنجه نرم کرد.
از مدل خواسته شد تا کرانی (Bound) را که توسط مل ناتانسون پیشنهاد شده بود، بهبود بخشد. ChatGPT 5.5 Pro پس از ۱۷ دقیقه و ۵ ثانیه تفکر، ساختاری را ارائه داد که منجر به یک کران بالای درجهدوم (Quadratic Upper Bound) شد.
در یک تکلیف پیچیدهتر، مدل توانست کرانی را که در متغیر k به صورت نمایی (Exponential) بود، به صورت چندجملهای (Polynomial) بهبود بخشد. اسحاق راجاگوپال، پژوهشگر MIT، بر اساس بررسی مستندات، این نتیجه را «تقریباً قطعاً درست» دانست و اشاره کرد که استفادهی مدل از مجموعههای k-dissociated، ایدهای «بدیع و هوشمندانه» است که استخراج آن برای یک پژوهشگر انسانی معمولاً هفتهها زمان میبرد.
این نتیجه بهطور بنیادی سطح استانداردهای پژوهش ریاضی را بالا میبرد. مسائل باز «ساده» — که زمانی برای آموزش دانشجویان سال اول دکترا استفاده میشدند — دیگر معیاری برای سنجش دستاوردهای انسانی نیستند، چرا که یک مدل استدلالی (Reasoning Model) میتواند آنها را در چند دقیقه حل کند.
گام بعدی شما
- بررسی ابزارهای تأیید رسمی (Formal Verification) برای گواهی دادن به اثباتهای تولید شده توسط AI بدون دخالت انسان.
- تغییر رویکرد پژوهشی از «حل مسئله» به «همکاری با AI» برای عبور از سقف استقلال مدل.
- مطالعهی متدهای جدید استنتاج در مدلهای زبانی برای بهینهسازی کرانهای ریاضی در پروژههای شخصی.
اما این توانایی در ریاضیات تنها بخشی از یک معماری بزرگتر است؛ در تحلیل ما دربارهی مدلهای استدلالی نسل جدید، ابعاد دیگر این تحول را بررسی کنید.
گفتگو