رویکرد Subquadratic هزینه و انرژی استنتاج در مدل‌های زبانی را کاهش داد

اگر همین حالا بودجه‌ای برای استفاده از APIهای هوش مصنوعی اختصاص داده‌اید، احتمالاً به‌زودی شاهد سقوط قیمت تولید هر توکن خواهید بود. شرکت Subquadratic راهکاری را معرفی کرده است که تعداد محاسبات مورد نیاز ترنسفورمر (Transformer) — همان ساختاری که قلب تپنده مدل‌های فعلی است — را برای تولید پاسخ‌ها به‌شدت کاهش می‌دهد. این شرکت مدلی را خلق کرده است که سریع‌تر و ارزان‌تر از هر گزینه دیگری است که در حال حاضر در بازار وجود دارد. هدف این فناوری، مصرف انرژی بسیار کمتر نسبت به هر مدل دیگری در بازار فعلی است.

مدل زبانی بزرگ (LLM) — شبیه کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — معمولاً در یک «گلوگاه محاسباتی» گیر می‌کند؛ جایی که با پیچیده‌تر شدن درخواست، هزینه سخت‌افزار و انرژی به‌سرعت بالا می‌رود. این خبر در زمانی منتشر می‌شود که سازمان‌ها با هزینه‌های سرسام‌آور APIها دست‌وپنجه نرم می‌کنند. این فشار مالی باعث شده تا برخی از کارکنان بخش فناوری، از استراتژی «بیشینه کردن توکن» (tokenmaxxing) به سمت «کمینه کردن توکن» (tokenminning) حرکت کنند تا هزینه‌ها را کاهش دهند. طبق گزارش MIT Technology Review در ۱۹ ژوئن ۲۰۲۶، این نوآوری در بهره‌وری می‌تواند این چرخه را بشکند.

به نقل از مستندات این شرکت، سیستم Subquadratic با کاهش سربارهای ریاضی که معمولاً در معماری ترنسفورمر مورد نیاز است، کار می‌کند. اگرچه الگوریتم دقیق و اختصاصی این شرکت محرمانه باقی مانده است، اما آن‌ها شروع به «به اشتراک گذاشتن رسیدها» (ارائه شواهد عملی) کرده‌اند تا ثابت کنند سیستم‌شان انرژی بسیار کمتری نسبت به مدل‌های موجود مصرف می‌کند.

بسیاری از متخصصان در ابتدا نسبت به این ادعاها شک داشتند. با این حال، شرکت Subquadratic اکنون پیشنهاد می‌کند که رویکرد آن‌ها در کاهش محاسبات، به مرحله‌ای رسیده که باید مورد توجه جدی قرار گیرد. این تغییر رویکرد نشان می‌دهد که عصر «هرچه بزرگ‌تر، بهتر» در آموزش مدل‌های هوش مصنوعی در حال برخورد با یک دیوار است و به بن‌بست رسیده است.

در کنار این تحول در AI، مرزهای فناوری زیستی، عصبی و رابط‌های دولتی نیز جابه‌جا می‌شوند و به نقاط عطف جدیدی رسیده‌اند. بر اساس گزارش‌های منتشر شده، تعداد داوطلبان آزمایش‌های رابط مغز و رایانه (BCI) در دو سال اخیر به‌شدت افزایش یافت. در سال ۲۰۲۶، چین نخستین کشوری شد که استفاده پزشکی از BCI را تأیید کرد. پیشرفت‌های فناورانه اکنون به مهندسان اجازه می‌دهد تا ویژگی‌های بیشتری نسبت به هر زمان دیگری در این سیستم‌ها فراهم کنند.

کیسی هرل، مردی مبتلا به ALS که نخستین «کاربر پیشرفته» این ایمپلنت‌های مغزی است، این فناوری را «چیزی فراتر از یک انقلاب» توصیف می‌کند. او از این دستگاه استفاده کرده است تا درآمد خود را حفظ کند، دوباره با دوستان و خانواده ارتباط بگیرد و برای دخترش کتاب بخواند. طبق گزارش MIT Technology Review، تعداد افرادی که الکترود در مغز دارند طی دو سال گذشته بیش از دو برابر شده است.

مناقشات گلوگاه هوش مصنوعی و آغاز آزمایش‌های رابط مغز-رایانه

با این حال، شتاب این فناوری‌ها ریسک‌های جدیدی را در حوزه‌های حرفه‌ای و ژنتیکی ایجاد کرده است. بر اساس مقالاتی در مجله Nature، اتکای بیش از حد به ابزارهای هوش مصنوعی در حال «تخریب مهارت‌های تخصصی» (Deskilling) است؛ به‌طوری که به نظر می‌رسد توانایی‌های تشخیصی و مهارت‌های عملی پزشکان و مهندسان در حال تضعیف می‌شود.

همزمان، دانشمندان هشدار می‌دهند که ساختار پیچیده ژنوم انسان ممکن است مدل‌های AI را به اشتباه بیندازد یا آن‌ها را گیج کند. این موضوع می‌تواند توسعه مدل‌های مبتنی بر AI برای زیست‌شناسی و درمان بیماری‌ها را محدود کند.

در حوزه اقتصادی و توزیع ثروت نیز، برنی سندرز طرح قانونی برای ایجاد یک «صندوق ثروت حاکمیتی AI» ارائه داده است. این صندوق قرار است از طریق یک مالیات یک‌باره بر سهام شرکت‌های هوش مصنوعی تأمین مالی شود و پرداختی‌های سالانه مستقیم به شهروندان آمریکا داشته باشد.

در لایه‌ی تجاری و سیاسی، گزارش‌هایی منتشر شده مبنی بر اینکه سرمایه‌گذاران چینی به‌طور مخفیانه در حال خرید سهم در SpaceX پیش از عرضه عمومی (IPO) بوده‌اند. در میان این افراد، فردی دیده می‌شود که با پیمانکاران نظامی چین در ارتباط است. این تح发的ات مالی در کنار تلفیق هوش مصنوعی و استراتژی‌های فضایی SpaceX است که باعث شد این شرکت از نظر ارزش بازار از غول‌هایی چون آمازون پیشی بگیرد.

دستاورد Subquadratic مسیر را به سمت «هوش مصنوعی ناب» (Lean AI) می‌برد. در این دنیای جدید، مزیت رقابتی از کسی که بیشترین تعداد GPU (واحد پردازش گرافیکی) — یعنی همان کرایه آشپزخانه‌های صنعتی سنگین — را در اختیار دارد، به کسی منتقل می‌شود که بهینه‌ترین روش ریاضی برای استنتاج (Inference) را یافته باشد.

برای مدیران کسب‌وکار، این یعنی هزینه هر توکن به‌جای اینکه مانعی اصلی برای طراحی محصول باشد، به‌زودی به یک رقم ناچیز در صورت‌حساب تبدیل شود. شما باید منتظر انتشار بنچمارک‌های عمومی از سوی Subquadratic باشید تا ببینید آیا این صرفه‌جویی‌های انرژی در مقیاس بزرگ و در وظایف استدلالی پیچیده نیز حفظ می‌شوند یا خیر.

گام بعدی شما

رصد کنید که آیا Subquadratic بنچمارک‌های عمومی خود را منتشر می‌کند یا خیر تا صحت ادعای کاهش انرژی در کارهای پیچیده اثبات شود.
اگر مدیر محصول هستید، استراتژی «کاهش توکن» را در مدل‌های فعلی بررسی کنید تا برای انتقال به مدل‌های بهینه‌تر آماده باشید.
تاثیرات احتمالی کاهش هزینه استنتاج بر مدل‌های درآمدی (Pricing) سرویس‌های AI را در نقشه راه خود بگنجانید.

اما اثر این بهینه‌سازی بر سخت‌افزارهای نسل بعد حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مناقشات گلوگاه هوش مصنوعی و آغاز آزمایش‌های رابط مغز-رایانه

گام بعدی شما

رصد کنید که آیا Subquadratic بنچمارک‌های عمومی خود را منتشر می‌کند یا خیر تا صحت ادعای کاهش انرژی در کارهای پیچیده اثبات شود.
اگر مدیر محصول هستید، استراتژی «کاهش توکن» را در مدل‌های فعلی بررسی کنید تا برای انتقال به مدل‌های بهینه‌تر آماده باشید.
تاثیرات احتمالی کاهش هزینه استنتاج بر مدل‌های درآمدی (Pricing) سرویس‌های AI را در نقشه راه خود بگنجانید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رویکرد Subquadratic هزینه و انرژی استنتاج در مدل‌های زبانی را کاهش داد

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رویکرد Subquadratic هزینه و انرژی استنتاج در مدل‌های زبانی را کاهش داد

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران