تصور کنید مدل زبانی شما بدون اینکه حتی یک کلمه از پرامپت را بخواند، دقیقاً بداند چه عددی را باید در چه عملیاتی به کار ببرد. این دیگر یک فرض نظری نیست؛ بلکه دستاوردی است که نحوه تعامل مدلها با ابزارهای خارجی را بهکلی تغییر میدهد.
به نقل از مستندات پروژه Rune که در ۵ ژوئن ۲۰۲۶ منتشر شد، فعالسازهای داخلی مدلهای Llama حاوی ساختارهای ریاضی قابل بازیابی هستند. این یعنی میتوان ابزارهای محاسباتی را بدون نیاز به تحلیل متن (Prompt Parsing) یا استفاده از ابزارهایی مثل Regex، مستقیماً بر اساس سیگنالهای داخلی مدل فعال کرد.
همانطور که در تحلیلهای پیشین ما دربارهی تفسیرپذیری مکانیکی (Mechanistic Interpretability) اشاره کردیم، درک لایههای پنهان مدلها کلید خروج از فضای «جعبه سیاه» است. این رویکرد در واقع تکملهای بر تلاشهای پیشین برای درک مکانیسم توجه و ریشههای توهم در مدلها است تا تصویری دقیقتر از نحوه پردازش اطلاعات در لایههای پنهان به دست آید. در حالی که چارچوبهای فعلی استفاده از ابزار مانند PAL یا ReAct منتظر میمانند تا مدل یک فرمان متنی صادر کند، رویکرد جدید پروژه Rune مستقیماً جریان باقیمانده (Residual Stream) — یا همان تختهسیاه داخلی مدل — را رصد میکند.
بر اساس بررسی دادههای مجموعهی ریاضی DeepMind، این مسیر «بدون پارسر» منجر به افزایش چشمگیر دقت در پاسخهای kesin مدلهای منجمد (Frozen) شد:
- بزرگترین مقسومعلیه مشترک (GCD): افزایش میانگین دقت ۰.۵۰۲
- تقسیم با باقیمانده: افزایش میانگین دقت ۰.۸۱۰
- کوچکترین مضرب مشترک (LCM): افزایش میانگین دقت ۰.۹۶۸
نکتهی حیاتی این است که این سامانه در مواجهه با ۱۰,۲۰۰ نمونهی «منفی سخت» (Hard-negative) که برای فریب دادن مدل طراحی شده بودند، حتی یکبار هم بهاشتباه فعال نشد. این امر ثابت میکند که «قصد ریاضی» (Arithmetic Intent) یک سیگنال متمایز و خواندنی در هندسهی ماتریس مدل است.
با این حال، پژوهشگران شکافی عمیق بین «خواندن» و «نوشتن» کشف کردند. در حالی که استخراج متغیرها از فعالسازها (Read) ممکن بود، تلاش برای بازگرداندن مقادیر اصلاحشده به جریان باقیمانده بهعنوان یک کامپایلر بهلحظه (Write) با شکست مواجه شد. این نشان میدهد که اگرچه اعداد در مدلهای زبانی بزرگ به صورت هندسهی فازی شبیه به مارپیچ (Helix-like phase geometry) نمایش داده میشوند، اما این حالتها هنوز بهعنوان یک ثباتی (Register) پویا و قابل برنامهریزی عمل نمیکنند.
این یافتهها توضیح میدهد چرا دقت مدلها در اعداد ۱۴ رقمی بهشدت افت میکند؛ پدیدهای که پژوهشگران آن را «تجمع تکهها» (Chunk Crowding) در فضای برداری مینامند. این یعنی مشکل دقت در اعداد بزرگ، صرفاً یک نقص در توکنبندی (Tokenization) نیست، بلکه یک محدودیت رزولوشن در ماتریسهای وزن است.
گام بعدی شما
- رصد توسعهی «مکانیابهای عملوند» (Operand Localizers) که اختصاصاً برای هر مدل طراحی میشوند.
- بررسی تستهای تبادل علی (Causal Interchange Tests) برای شناسایی دقیق لایهای که منطق ریاضی را مدیریت میکند.
- ارزیابی مدلهای Llama را از منظر هندسهی برداری بهجای تحلیل صرفاً متنی.
اما این تنها آغاز ماجراست؛ اثر این کشف بر معماری نسل بعدی مدلهای استدلالی را در گزارشهای آتی بررسی خواهیم کرد.

گفتگو