اگر تصور میکنید مدلهای زبانی مانند انسانها یاد میگیرند، در واقع حیاتیترین شکاف معماری شناختی را نادیده گرفتهاید. باید بدانید که تفاوت میان یک برنامهنویس خبره و یک مدل پیشرفته، در نحوه مواجهه با «ناشناختههای آینده» نهفته است.
بر اساس یافتههای جدید، انسانها انتزاهات را از طریق فشردهسازی آیندهنگر (Prospective Compression) میسازند؛ یعنی پیشبینی میکنند که در آینده به چه ابزارهایی نیاز خواهند داشت. در مقابل، مدلهای زبانی صرفاً دادههای گذشته را فشرده میکنند. این یعنی مدلها «واکنشی» هستند، در حالی که انسانها «پیشبین» عمل میکنند.
همانطور که در تحلیلهای پیشین ما دربارهی سوگیریهای استقرایی (Inductive Biases) در مدلهای زبانی اشاره کردیم، این محدودیتها مانع از آن میشود که مدلها در محیطهای غیرایستا به درستی عمل کنند.
در حوزه سنتز برنامه (Program Synthesis)، فرآیندی به نام یادگیری آنلاین کتابخانه (Online Library Learning) وجود دارد که در آن قطعات کد قابلبازاستفاده برای حل مسائل پیچیده ایجاد میشوند. طبق گزارشی که در ۱۱ مه ۲۰۲۶ در arxiv.org منتشر شد، پژوهشگر مارتا کرایون (Marta Kryven) با استفاده از «تکلیف سازنده الگو» (Pattern Builder Task) این فرضیه را به چ({img:1}) کرد. او رفتار انسانها را با ۶ مدل محاسباتی مقایسه کرد و دریافت که انسانها به ساختارهای پنهان و متغیر در فرآیند تولید تکالیف حساس هستند، اما مدلها خیر.
این یافته نشان میدهد که هوش مصنوعی زاینده (Generative AI) در حال حاضر در تلهی تطبیق الگوهای استاتیک گرفتار است. مدلها در تطبیق با مجموعهای از دادههای ثابت عالی هستند، اما مکانیسم لازم برای پیشبینی کاربردهای آتی را ندارند.
گام بعدی شما
- بررسی متدولوژیهای تزریق سوگیری آیندهنگر در یادگیری تقویتشده (RL).
- تحلیل تفاوت میان «فشردهسازی داده» و «استخراج استراتژیک» در معماریهای جدید.
- رصد بنچمارکهای جدیدی که توانایی مدل در ایجاد توابع کمکی برای تکالیف دیدهنشده را میسنجند.
این تنها آغاز ماجراست؛ اثر این شکاف شناختی بر توسعه عاملهای خودمختار را در گزارش بعدی بررسی خواهیم کرد.




گفتگو