پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۳ مقاله منتشر شده

DFlash: پیش‌نویسی بلوک‌های کامل توکن به صورت موازی برای افزایش ۱۵ برابری توان عملیاتی در پردازنده‌های انویدیا بلک‌ول

روش DFlash توان عملیاتی تراشه‌های Blackwell انویدیا را ۱۵ برابر کرد

پژوهشگران دانشگاه سن‌دیگو با معرفی DFlash، رمزگشایی گمانه‌زنانه را از حالت تک‌به‌تک به بلوک‌های موازی تغییر دادند. این متد بدون کاهش کیفیت خروجی، سرعت استنتاج را در سخت‌افزارهای…

۵ دقیقه خواندن
نمایش ساختار Sparse Attention در مدل MiniMax M3: کاهش پیچیدگی محاسباتی از O(n²) به O(n) با استفاده از انتخاب هوشمندانه توکن‌ه

«بهینه‌سازی استنتاج طولانی»؛ هدف اصلی در طراحی مدل وزن‌باز M3

مدل وزن‌باز M3 با پنجره متنی یک میلیون توکنی و قابلیت‌های چندوجهی معرفی شد. این مدل با استفاده از معماری توجه پراکنده (MSA)، هزینه محاسباتی استنتاج در متون طولانی را به‌شدت کاهش…

۴ دقیقه خواندن
GitHub - y-times-y/y: یک برنامه عامل کدنویسی انعطاف‌پذیر. با Claude Code و Codex پروژه بسازید و خود y را بازطراحی کنید.
آموزش کاربردی

درون معماری پروژه y؛ پیوند عامل‌های هوش مصنوعی با رابط‌های کاربری پویا

پروژه y محیط کدنویسی جدیدی است که اجازه می‌دهد رابط کاربری (UI) آن توسط عامل‌های میزبانی‌شده به‌صورت زنده تغییر کند. این سیستم با جداسازی هسته مرکزی از لایه کاربر، امنیت را در حین…

۳ دقیقه خواندن
کنترل‌گر مدل کاربر: چالش لایه کنترل در BYOM

پشتیبانی از کلیدهای شخصی در Copilot؛ انتقال چالش از انتخاب مدل به مدیریت عملیات

گیت‌هاب کوپایلت اکنون اجازه می‌دهد کاربران با استفاده از کلیدهای شخصی (BYOK)، مدل‌های مختلف و ارائه‌دهندگان خارجی را متصل کنند. این تغییر، اولویت تیم‌های مهندسی را از «بهترین مدل…

۸ دقیقه خواندن
بیشتر عامل‌ها «نابینای وضعیت» هستند. با یک لایه هماهنگ‌سازی و درخت بصری مصنوعی، حافظه اپیزودیک واقعی به آن‌ها دادم.
آموزش کاربردی

Atom با لایه معنایی درخت‌های بصری توهم عامل‌های هوش مصنوعی را می‌گیرد

پلتفرم Atom با جایگزینی تصاویر خام با یک لایه توصیفی ساختاریافته، از توهم عامل‌ها در تأیید موفقیت ابزارها جلوگیری می‌کند. این سیستم با ترکیب حافظه اپیزودیک و ماشین حالت، دقت اجرای…

۲ دقیقه خواندن
نقاط پایانی خودکار مُدال: استنتاج بهینه‌شده که واقعاً متعلق به شماست | وبلاگ Modal
آموزش کاربردی

Auto Endpoints در برابر ارائه‌دهندگان مدیریت‌شده؛ شفافیت در برابر جعبه‌سیاه

سرویس Auto Endpoints از شرکت Modal به توسعه‌دهندگان اجازه می‌دهد استنتاج مدل‌های زبانی بزرگ را با دسترسی کامل به کد و متریک‌ها مدیریت کنند. این پلتفرم با ادغام موتورهای متن‌باز و…

۷ دقیقه خواندن
فرمت فایل داده متن‌باز F3 برای آینده [SIGMOD 2026]
آموزش کاربردی

F3: استاندارد بازمتن برای رفع گلوگاه‌های ذخیره‌سازی داده در مدل‌های AI

پروژه F3 با معرفی یک قالب فایل استاندارد و بازمتن، به دنبال بهینه‌سازی دسترسی به مجموعه‌داده‌های عظیم برای نسل جدید زیرساخت‌های یادگیری ماشین است. این استاندارد قصد دارد وابستگی…

۱ دقیقه خواندن