تصور کنید تمام قدرت یک هوش مصنوعی عمومی در دستان شما باشد، بدون نیاز به یک مرکز داده عظیم. اگر هنوز فکر میکنید برای رسیدن به AGI به هزاران پردازنده گرافیکی نیاز است، باید این گزارش را بخوانید.
به نقل از یک پست جنجالی در dev.to، یک توسعهدهنده مستقل ادعا کرده است که موفق شده یک سیستم هوش مصنوعی عمومی (Artificial General Intelligence - AGI) را روی یک CPU معمولی لپتاپ جای دهد. این اقدام، ضربهای مستقیم به باور رایج صنعت است که موفقیت را تنها در افزایش تعداد پارامترها و خوشههای گرانقیمت GPU میبیند.
طبق اعلام این توسعهدهنده در ۲۷ آوریل ۲۰۲۶، او طی سه هفته توانسته است یک معماری کامل را از طریق تقطیر (Distillation) به یک نسخه کوچک با کوانتایزاسیون ترکیبی (Hybrid-quantization) تبدیل کند. این مدل که با زبان Python و رابط Gradio ساخته شده، هماکنون برای تست عمومی در Hugging Face در دسترس است. نویسنده صراحتاً اعلام کرد که دلیل این فشردهسازی، هزینههای سرسامآور قدرت محاسباتی (Compute) در ابر بود که انتشار عمومی پروژه را غیرممکن میکرد.
بر اساس مستندات این پروژه، فرآیند کوچکسازی مدل بسیار دشوار بوده است؛ به طوری که ۸۰ درصد تلاشها صرف طراحی معماری بهینهسازی و تنها ۲۰ درصد آن به پیادهسازی کد اختصاص یافته است. این سیستم روی سختافزارهای مصرفکننده بدون نقص اجرا میشود، هرچند که نویسنده پذیرفته است سرعت استنتاج (Inference) در این حالت پایین است.
همانطور که در تحلیلهای پیشین ما دربارهی مدلهای زبانی کوچک (Small Language Models - SLM) اشاره کردیم، گرایش به سمت بهرهوری در لبه، در حال تبدیل شدن به یک استراتژی کلیدی است. این پروژه دقیقاً در همین راستاست و ادعا میکند که «هوش واقعی در سازگاری و حل مسئله با پارامترهای کمتر است»، نه در حجم عظیم دادهها.
این ادعا در حالی مطرح میشود که غولهای فناوری در یک مسابقه تسلیحاتی برای ساخت مدلهای بزرگتر با بودجههای میلیاردی هستند. اگر ادعاهای این توسعهدهنده تحت بررسی جامعه متنباز تایید شود، میتوانیم شاهد یک چرخش راهبردی به سمت معماریهای سازگار با رایانش لبه (Edge Computing) باشیم که وابستگی به ابر را به کلی حذف میکند.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چگونه تراشههای نسل جدید این مسیر را هموار میکنند، به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گام بعدی شما
- مدل منتشر شده در Hugging Face را روی سختافزار محلی خود تست کنید.
- مستندات کامل توسعه را در GitBook پروژه بررسی کنید تا با متدولوژی کوانتایزاسیون ترکیبی آشنا شوید.
- بررسی کنید که کدام بخش از جریان کاری شما میتواند از مدلهای فشردهشده به جای APIهای ابری استفاده کند.




گفتگو