اگر همین حالا بودجهای برای استفاده از APIهای هوش مصنوعی اختصاص دادهاید، احتمالاً بهزودی شاهد سقوط قیمت تولید هر توکن خواهید بود. شرکت Subquadratic راهکاری را معرفی کرده است که تعداد محاسبات مورد نیاز ترنسفورمر (Transformer) — همان ساختاری که قلب تپنده مدلهای فعلی است — را برای تولید پاسخها بهشدت کاهش میدهد. این شرکت مدلی را خلق کرده است که سریعتر و ارزانتر از هر گزینه دیگری است که در حال حاضر در بازار وجود دارد. هدف این فناوری، مصرف انرژی بسیار کمتر نسبت به هر مدل دیگری در بازار فعلی است.
مدل زبانی بزرگ (LLM) — شبیه کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — معمولاً در یک «گلوگاه محاسباتی» گیر میکند؛ جایی که با پیچیدهتر شدن درخواست، هزینه سختافزار و انرژی بهسرعت بالا میرود. این خبر در زمانی منتشر میشود که سازمانها با هزینههای سرسامآور APIها دستوپنجه نرم میکنند. این فشار مالی باعث شده تا برخی از کارکنان بخش فناوری، از استراتژی «بیشینه کردن توکن» (tokenmaxxing) به سمت «کمینه کردن توکن» (tokenminning) حرکت کنند تا هزینهها را کاهش دهند. طبق گزارش MIT Technology Review در ۱۹ ژوئن ۲۰۲۶، این نوآوری در بهرهوری میتواند این چرخه را بشکند.
به نقل از مستندات این شرکت، سیستم Subquadratic با کاهش سربارهای ریاضی که معمولاً در معماری ترنسفورمر مورد نیاز است، کار میکند. اگرچه الگوریتم دقیق و اختصاصی این شرکت محرمانه باقی مانده است، اما آنها شروع به «به اشتراک گذاشتن رسیدها» (ارائه شواهد عملی) کردهاند تا ثابت کنند سیستمشان انرژی بسیار کمتری نسبت به مدلهای موجود مصرف میکند.
بسیاری از متخصصان در ابتدا نسبت به این ادعاها شک داشتند. با این حال، شرکت Subquadratic اکنون پیشنهاد میکند که رویکرد آنها در کاهش محاسبات، به مرحلهای رسیده که باید مورد توجه جدی قرار گیرد. این تغییر رویکرد نشان میدهد که عصر «هرچه بزرگتر، بهتر» در آموزش مدلهای هوش مصنوعی در حال برخورد با یک دیوار است و به بنبست رسیده است.
در کنار این تحول در AI، مرزهای فناوری زیستی، عصبی و رابطهای دولتی نیز جابهجا میشوند و به نقاط عطف جدیدی رسیدهاند. بر اساس گزارشهای منتشر شده، تعداد داوطلبان آزمایشهای رابط مغز و رایانه (BCI) در دو سال اخیر بهشدت افزایش یافت. در سال ۲۰۲۶، چین نخستین کشوری شد که استفاده پزشکی از BCI را تأیید کرد. پیشرفتهای فناورانه اکنون به مهندسان اجازه میدهد تا ویژگیهای بیشتری نسبت به هر زمان دیگری در این سیستمها فراهم کنند.
کیسی هرل، مردی مبتلا به ALS که نخستین «کاربر پیشرفته» این ایمپلنتهای مغزی است، این فناوری را «چیزی فراتر از یک انقلاب» توصیف میکند. او از این دستگاه استفاده کرده است تا درآمد خود را حفظ کند، دوباره با دوستان و خانواده ارتباط بگیرد و برای دخترش کتاب بخواند. طبق گزارش MIT Technology Review، تعداد افرادی که الکترود در مغز دارند طی دو سال گذشته بیش از دو برابر شده است.

با این حال، شتاب این فناوریها ریسکهای جدیدی را در حوزههای حرفهای و ژنتیکی ایجاد کرده است. بر اساس مقالاتی در مجله Nature، اتکای بیش از حد به ابزارهای هوش مصنوعی در حال «تخریب مهارتهای تخصصی» (Deskilling) است؛ بهطوری که به نظر میرسد تواناییهای تشخیصی و مهارتهای عملی پزشکان و مهندسان در حال تضعیف میشود.
همزمان، دانشمندان هشدار میدهند که ساختار پیچیده ژنوم انسان ممکن است مدلهای AI را به اشتباه بیندازد یا آنها را گیج کند. این موضوع میتواند توسعه مدلهای مبتنی بر AI برای زیستشناسی و درمان بیماریها را محدود کند.
در حوزه اقتصادی و توزیع ثروت نیز، برنی سندرز طرح قانونی برای ایجاد یک «صندوق ثروت حاکمیتی AI» ارائه داده است. این صندوق قرار است از طریق یک مالیات یکباره بر سهام شرکتهای هوش مصنوعی تأمین مالی شود و پرداختیهای سالانه مستقیم به شهروندان آمریکا داشته باشد.
در لایهی تجاری و سیاسی، گزارشهایی منتشر شده مبنی بر اینکه سرمایهگذاران چینی بهطور مخفیانه در حال خرید سهم در SpaceX پیش از عرضه عمومی (IPO) بودهاند. در میان این افراد، فردی دیده میشود که با پیمانکاران نظامی چین در ارتباط است. این تح发的ات مالی در کنار تلفیق هوش مصنوعی و استراتژیهای فضایی SpaceX است که باعث شد این شرکت از نظر ارزش بازار از غولهایی چون آمازون پیشی بگیرد.
دستاورد Subquadratic مسیر را به سمت «هوش مصنوعی ناب» (Lean AI) میبرد. در این دنیای جدید، مزیت رقابتی از کسی که بیشترین تعداد GPU (واحد پردازش گرافیکی) — یعنی همان کرایه آشپزخانههای صنعتی سنگین — را در اختیار دارد، به کسی منتقل میشود که بهینهترین روش ریاضی برای استنتاج (Inference) را یافته باشد.
برای مدیران کسبوکار، این یعنی هزینه هر توکن بهجای اینکه مانعی اصلی برای طراحی محصول باشد، بهزودی به یک رقم ناچیز در صورتحساب تبدیل شود. شما باید منتظر انتشار بنچمارکهای عمومی از سوی Subquadratic باشید تا ببینید آیا این صرفهجوییهای انرژی در مقیاس بزرگ و در وظایف استدلالی پیچیده نیز حفظ میشوند یا خیر.
گام بعدی شما
- رصد کنید که آیا Subquadratic بنچمارکهای عمومی خود را منتشر میکند یا خیر تا صحت ادعای کاهش انرژی در کارهای پیچیده اثبات شود.
- اگر مدیر محصول هستید، استراتژی «کاهش توکن» را در مدلهای فعلی بررسی کنید تا برای انتقال به مدلهای بهینهتر آماده باشید.
- تاثیرات احتمالی کاهش هزینه استنتاج بر مدلهای درآمدی (Pricing) سرویسهای AI را در نقشه راه خود بگنجانید.
اما اثر این بهینهسازی بر سختافزارهای نسل بعد حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.

گفتگو