اگر تصور میکنید مدلهای هوش مصنوعی میتوانند بدون پرداخت بهای محاسباتی به حافظهای بینهایت دست یابند، در واقع در تعقیب یک شبح هستید. باید بدانید که یک سقف سخت و غیرقابل عبور برای توانمندیهای معماریهای بافتبلند وجود دارد که هیچ مقدار پردازش اضافهای نمیتواند آن را بشکند.
به نقل از مقالهای که در ۷ می ۲۰۲۶ در arxiv.org منتشر شد، هیچ مدل هوش مصنوعی نمیتواند بهطور همزمان سه ویژگی کلیدی «بهرهوری»، «فشردهسازی» و «بازیابی» را بهینه کند. پژوهشگران این پدیده را «مثلث ناممکن» (Impossibility Triangle) نامیدهاند؛ اثباتی ریاضی که نشان میدهد هر مدلی که بخواهد محاسبات هر گام و اندازه وضعیت خود را ثابت نگه دارد، ناگزیر است بخشی از حقایق را متناسب با افزایش طول توالی فراموش کند.
بر اساس مستندات این پژوهش، ۵۲ معماری مختلف منتشرشده تا پیش از مارس ۲۰۲۶، از جمله ترنسفورمرها (Transformers)، مدلهای فضای حالت (State Space Models - SSMs) و شبکههای بازگشتی خطی مورد تحلیل قرار گرفتند. یافتهها صریح هستند:
- بهرهوری (Efficiency): محاسبات هر گام باید مستقل از طول توالی باشد.
- فشردهسازی (Compactness): اندازه وضعیت (State size) باید مستقل از طول توالی باشد.
- بازیابی (Recall): توانایی بازیابی حقایق تاریخی متناسب با طول توالی.
نویسندگان با استفاده از «نابرابری پردازش دادهها» و «نابرابری فانو»، ثابت کردند مدلهایی که هر دو شرط بهرهوری و فشردهسازی را دارند، تنها میتوانند تعداد محدودی از جفتهای کلید-مقدار را بازیابی کنند. آزمایشها روی پنج معماری شاخص تایید کرد که ظرفیت بازیابی تجربی، دقیقاً زیر این حد تئوریک قرار دارد.
همانطور که در تحلیلهای پیشین ما دربارهی قوانین مقیاسپذیری (Scaling Laws) اشاره کردیم، افزایش صرفِ اندازه مدلها همیشه پاسخگوی نیازهای عملیاتی نیست. این کشف، رقابت فعلی صنعت برای دستیابی به «پنجره بافت» (Context Window) بینهایت را به چالش میکشد. شما اکنون باید انتخاب کنید: استنتاج (Inference) کندتر، سربار حافظه عظیم، یا پذیرش فقدان ناگزیر حقایق حیاتی در تاریخچه گفتگو.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گام بعدی شما
- اگر از مدلهای با بافت بسیار بلند استفاده میکنید، به جای اعتماد مطلق به حافظه مدل، استراتژیهای تولید بازیابیافزا (RAG) را تقویت کنید.
- در طراحی سیستمهای عاملمحور، برای دادههای حیاتی از مکانیزمهای ذخیرهسازی خارجی استفاده کنید تا اثر مثلث ناممکن را خنثی کنید.
- بر روی مدلهای هیبریدی تمرکز کنید که سعی دارند در فضای داخلی این مثلث، تعادلی میان سرعت و دقت ایجاد کنند.




گفتگو