اگر امروز صدها سند را با هوش مصنوعی تحلیل میکنید، احتمالاً شاهد رشد تصاعدی صورتحساب پردازش خود هستید. این مشکل ناشی از «گسترش درجه دوم» در مدلهای استاندارد است که اکنون استارتآپ Subquadratic با مدل جدید خود، SubQ، قصد دارد آن را به پایان برساند.
بیشتر مدلهای زبانی بزرگ (LLM) — شبیه کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — از «توجه متراکم» استفاده میکنند. در این حالت، هر کلمه با تمام کلمات دیگر متن ضرب میشود که باعث مصرف انرژی و سختافزار بهشدت بالا میشود. همانطور که در تحلیل قبلی ما دربارهی بهینهسازی قیمتگذاری در شرکتهایی مثل Oxlo.ai اشاره کردیم، Subquadratic این مشکل را در سطح معماری حل کرده است. تصور کنید کتاب میخوانید؛ برای فهم داستان، هر کلمه را با تمام کلمات قبلی مقایسه نمیکنید، بلکه فقط روی بخشهای کلیدی تمرکز میکنید.

در ۱۹ ژوئن ۲۰۲۶، MIT Technology Review گزارش داد که شرکت مستقل Appen ادعاهای عملکردی SubQ را تأیید کرده است. بر اساس مستندات این بررسی:
- سرعت: SubQ در آزمونهای پایه ۵۶ برابر سریعتر از مدلهای مجهز به توجه برقآسا (FlashAttention) بود.
- بازیابی: در آزمون «سوزن در انبار کاه»، با پنجرهٔ زمینه (Context Window) — مانند میز کاری که جا برای چند ورق دارد، نه برای کل کتابخانه — تا ۱۲ میلیون توکن (Token) به دقت ۹۸٪ رسید.
- کدنویسی: در محک LiveCodeBench امتیاز ۸۹.۷٪ گرفت که با مدلهای پیشروی OpenAI و Google DeepMind برابری میکند.
- هزینه: طبق اعلام جاستین دانگل، مدیرعامل شرکت، آزمونی که برای مدل Opus 4.6 شرکت Anthropic حدود ۲۶۰۰ دلار هزینه داشت، در SubQ تنها ۸ دلار هزینه برد.
این تغییر به سمت «توجه پراکنده» (Sparse Attention) به این معناست که مدل در لحظه تصمیم میگیرد کدام توکنها مهم هستند. برای یک کاربر تجاری، این یعنی تبدیل هوش مصنوعی از یک ابزار لوکس به یک سرویس مقیاسپذیر برای تحلیل کل کدهای یک پروژه یا آرشیوهای عظیم حقوقی، بدون اینکه هزینهها بهصورت خطی منفجر شوند. این بهینهسازی هزینهای، گامی حیاتی برای سازمانهایی است که چالشهای مقیاسپذیری مدلها در سطح صنعتی را با ریسکهای کیفی مواجه بودهاند.
با این حال، برخی تحلیلگران تردید دارند؛ زیرا Subquadratic بهجای آموزش از صفر، از وزنهای مدل متنباز Qwen استفاده کرده است. تا زمانی که این مدل از لیست انتظار خارج شود، مشخص نخواهد بود که آیا این گلوگاه واقعاً حل شده یا فقط تعدیل شده است.
گام بعدی شما
- اگر با دادههای متنی حجیم سروکار دارید، نام خود را در لیست انتظار SubQ ثبت کنید.
- هزینههای استنتاج (Inference) — یعنی لحظهای که مدل واقعاً جواب تولید میکند — مدلهای فعلی خود را با معیارهای SubQ مقایسه کنید.
- منتظر انتشار نسخهی عمومی باشید تا پایداری این عملکرد در تسکهای واقعی سازمانی بررسی شود.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو