تصور کنید برای یافتن یک فرمول ریاضی در میان میلیاردها احتمال، به جای جستوجوی تصادفی، نقشهای دقیق داشته باشید. اگر هنوز از روشهای سنتی تکاملی برای استخراج قوانین علمی استفاده میکنید، باید بدانید که عصر «شانس» در رگرسیون نمادین به پایان رسیده است.
رگرسیون نمادین (Symbolic Regression) چالش دیرینه یافتن دقیقترین فرمول ریاضی است که یک پدیده طبیعی را بر اساس دادههای خام توصیف میکند. طبق اعلام پژوهشگران در مقالهای که ۱۲ مه ۲۰۲۶ در arXiv منتشر شد، چارچوب GESR با معرفی دو «دست هدایتگر» برای کنترل تکامل، مشکل «سکه انداختن» در مدلهای قدیمی را حل کرده است.
همانطور که در تحلیلهای پیشین ما دربارهی بهینهسازی مدلهای غیر-عصبی اشاره کردیم، اتکای شدید به تصادف، بزرگترین گلوگاه پیشرفت در این حوزه بود. در برنامهریزی ژنتیکی (Genetic Programming) کلاسیک، جهشها و تقاطعها بهصورت تصادفی (Stochastic) رخ میدهند که منجر به هدررفت عظیم قدرت محاسباتی روی فرمولهای بیمعنی میشود.
معماری GESR برای حذف این اتلافها از دو مدل BERT مجزا استفاده میکند:
- هدایت جهش: مدل اول با استفاده از مدلسازی زبان ماسکشده (Masked Language Modeling)، نمادهای ریاضی (ژنها) را پیشبینی کرده و جهشها را بهصورت هدفمند هدایت میکند.
- پیشبینی تقاطع: مدل دوم نقطه بهینه تقاطع (Crossover) بین ژنها را پیشبینی میکند تا تغییرات ایجاد شده بیشترین سود عملی را داشته باشند.
این ادغام یادگیری عمیق در الگوریتمهای تکاملی، این فرض بنیادین را که برنامهریزی ژنتیکی برای اثربخشی باید کاملاً تصادفی بماند، میشکند. با بهرهگیری از قدرت تشخیص الگوی BERT، فضای جستوجو کوچکتر شده و سرعت همگرایی به قوانین ریاضی دقیق افزایش مییابد. این نشاندهنده روند گستردهتری است که در آن معماریهای مبتنی بر مدلهای زبانی، نه برای تولید متن، بلکه برای بهینهسازی ساختاری مدلهای غیر-عصبی به کار گرفته میشوند.
گام بعدی شما
- بررسی قابلیت مقیاسپذیری این روش در مسائل فیزیکی با ابعاد بالا که فضای جستوجوی آنها برای GP سنتی بیش از حد وسیع است.
- رصد بنچمارکهای آتی برای مشاهده اینکه آیا GESR میتواند قوانین ناشناخته طبیعت را بدون پیشفرضهای انسانی کشف کند یا خیر.
اما تأثیر این رویکرد بر کاهش هزینههای محاسباتی در مقیاس صنعتی، موضوع تحلیل بعدی ماست.
گفتگو