رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

اگر تصور می‌کنید هدایت یک مدل زبانی بزرگ (Large Language Model - LLM) از طریق بردارهای خطی ثابت امکان‌پذیر است، در واقع در حال تعقیب یک شبح هستید. باور عمومی در جامعه‌ی یادگیری ماشین بر این بود که هر قابلیت یا تکلیف خاص، در فضای وزن‌های مدل، یک جهت خطی ثابت و قابل شناسایی دارد؛ اما واقعیت بسیار متلاطم‌تر است.

بر اساس مطالعه‌ای که در ۱۰ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، ساختارهای خطیِ مربوط به گرادیانِ تکالیف در مدل‌های زبانی، هندسه‌های محلی در حال تکاملی هستند که حتی در بازه‌ی کوتاهی نظیر ۱۰۰ گام، به‌طور قابل‌توجهی تغییر می‌کنند. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی تفسیرپذیری مکانیکی (Mechanistic Interpretability) اشاره کردیم، درک نحوه ذخیره‌سازی مفاهیم در لایه‌های مدل، کلید دستیابی به کنترل کامل بر خروجی‌هاست.

این پژوهش که روی مدل‌های DistilGPT-2، GPT-2 و Qwen-0.5B انجام شده، نتایج زیر را به دست آورد:

• شناسایی یک «پایهٔ پیشوند-مسیر» (Trajectory-prefix basis) که در آن، نخستین به‌روزرسانی‌های بازیابی، ۷۷٪ از جابه‌جایی بازیابی LoRA را پوشش می‌دهند.
• مشاهده‌ی شباهت کسینوسی ۰.۵۸ میان تغییر فعال‌سازیِ یک گامِ واحدِ گرادیان و بردار هدایت CAA برچسب‌دار.

طبق گزارش پژوهشگران، این یافته‌ها نشان می‌دهد که موفقیت روش‌هایی نظیر LoRA یا هدایت فعال‌سازها (Activation Steering)، نه به دلیل وجود یک صفحهٔ جهانی برای هر تکلیف، بلکه نتیجه‌ی بهره‌گیری از هندسه‌ محلی است. در واقع، موفقیت جست‌وجوی تصادفی پارامترها در ابعاد بالا، بیشتر با «قضیه محلی-خطی گاوسی» توجیه می‌شود تا وجود یک مختصات ثابت روی نقشه.

این کشف، پیش‌فرض‌های بنیادی درباره‌ی تفسیرپذیری مدل‌ها را تغییر می‌دهد: ساختارهای خطی دیگر مختصاتی روی یک نقشه نیستند، بلکه شبیه به جریان‌های متحرک در یک رودخانه‌اند.

گام بعدی شما

بررسی جایگزینی بردارهای هدایت استاتیک با مبناهای دینامیک و متغیر برای افزایش دقت در هدایت بلندمدت مدل‌ها.
تحلیل اثر رانش هندسی بر پایداری مدل‌هایی که با روش‌های Low-Rank Adaptation آموزش دیده‌اند.
رصد پژوهش‌های آتی برای پیش‌بینی این هندسه‌های تکاملی به‌منظور اتوماسیون ساخت آداپتورهای بهینه‌تر.

اما اثر این رانش بر حافظه‌ی بلندمدت مدل‌ها حتی پیچیده‌تر است — به بررسی ما درباره‌ی معماری‌های جدید بازیابی داده مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

این پژوهش که روی مدل‌های DistilGPT-2، GPT-2 و Qwen-0.5B انجام شده، نتایج زیر را به دست آورد:

گام بعدی شما

بررسی جایگزینی بردارهای هدایت استاتیک با مبناهای دینامیک و متغیر برای افزایش دقت در هدایت بلندمدت مدل‌ها.
تحلیل اثر رانش هندسی بر پایداری مدل‌هایی که با روش‌های Low-Rank Adaptation آموزش دیده‌اند.
رصد پژوهش‌های آتی برای پیش‌بینی این هندسه‌های تکاملی به‌منظور اتوماسیون ساخت آداپتورهای بهینه‌تر.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران