
درون مکانیزم GQA و توالیهای فشرده برای ارتقای کارایی مدلهای هوش مصنوعی
کتابخانهی xFormers با جایگزینی محاسبات سنگین ماتریسی با هستههای بهینه، مصرف حافظهی GPU را برای مدلهای با پنجرههای متنی بلند به شدت کاهش میدهد. این ابزار با پیادهسازی…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۶ مقاله منتشر شده

کتابخانهی xFormers با جایگزینی محاسبات سنگین ماتریسی با هستههای بهینه، مصرف حافظهی GPU را برای مدلهای با پنجرههای متنی بلند به شدت کاهش میدهد. این ابزار با پیادهسازی…

یک توسعهدهنده با انتقال کارهای ساده به مدلهای ارزانقیمت و رزرو مدلهای سطحبالا برای پرسوجوهای پیچیده، صورتحساب ماهانه OpenAI خود را ۶۰٪ کاهش داد. این استراتژی ثابت میکند که…

پلتفرم VTrade چارچوب جدیدی برای تزریق دادههای خصوصی و ابزارهای شخصی به Copilot خود معرفی کرد. این سیستم با استفاده از یک «شکاف سختافزاری رمزنگاریشده»، اجازه نمیدهد عاملها…

راهنمای عملی خانواده مدلهای SmolLM2 تفاوتهای حیاتی بین مدلهای بنیادی، تنظیمشده برای دستورات و مدلهای گفتگو-محور را بررسی میکند. درک این سه مرحله آموزشی توضیح میدهد چرا یک…

دولت آمریکا بهدلیل نگرانیهای امنیت ملی، شرکت Anthropic را مجبور به توقف دسترسی به مدل کدنویسی Fable 5 کرد. این اتفاق ریسک وابستگی کسبوکارها به یک مدل واحد را برجسته کرد و نیاز…

انویدیا ابزار cuTile Rust را معرفی کرد تا برنامهنویسان بتوانند کرنلهای GPU را با امنیت حافظه و بدون ریسک Data Race بنویسند. این سیستم عملکردی نزدیک به cuBLAS دارد اما خطاهای…

اسپیساکس با خرید استارتاپ Cursor به ارزش ۶۰ میلیارد دلار، ارزش بازار خود را به ۲.۶ تریلیون دلار رساند. این اقدام تلاش ایلان ماسک برای تبدیل شرکتش به یک غول هوش مصنوعی است، آن هم…

مایکروسافت برای کنترل هزینههای سرسامگیر کاربران حرفهای، مدل قیمتگذاری Copilot Cowork را از اشتراک ثابت به پرداخت بر اساس میزان مصرف تغییر میدهد. این شرکت همچنین احتمالاً از…

ایران استعدادِ فنیِ قوی دارد، اما در هوش مصنوعی فاصلهاش با آمریکا و چین زیاد است. علتش یک شکستِ واحد نیست، چند سدِ ساختاری است: شکافِ محاسبات و سختافزار (تحریم دسترسی به…

پژوهشگران حفرهای امنیتی به نام SearchLeak کشف کردند که امکان سرقت کدهای تأیید دو مرحلهای و ایمیلهای داخلی کاربران مایکروسافت کوپایلوت را فراهم میکند. این اکسپلویت با استفاده…

شرکت اسپیسایکس در قراردادی به ارزش ۶۰ میلیارد دلار، مالکیت Anysphere (توسعهدهنده Cursor AI) را به دست آورد. هدف ایلان ماسک ادغام مهندسی کد خودکار در زیرساختهای هوافضا و…

دولت آمریکا به دلیل نگرانی از شکست امنیتی مدلهای پیشرفته، دسترسی کاربران خارجی به Claude Mythos 5 و Fable 5 را مسدود کرد. این اقدام با واکنش تند صنعت همراه شده و هشدار میدهد که…