
درون مکانیزم GQA و توالیهای فشرده برای ارتقای کارایی مدلهای هوش مصنوعی
کتابخانهی xFormers با جایگزینی محاسبات سنگین ماتریسی با هستههای بهینه، مصرف حافظهی GPU را برای مدلهای با پنجرههای متنی بلند به شدت کاهش میدهد. این ابزار با پیادهسازی…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۶ مقاله منتشر شده

کتابخانهی xFormers با جایگزینی محاسبات سنگین ماتریسی با هستههای بهینه، مصرف حافظهی GPU را برای مدلهای با پنجرههای متنی بلند به شدت کاهش میدهد. این ابزار با پیادهسازی…

یک توسعهدهنده با انتقال کارهای ساده به مدلهای ارزانقیمت و رزرو مدلهای سطحبالا برای پرسوجوهای پیچیده، صورتحساب ماهانه OpenAI خود را ۶۰٪ کاهش داد. این استراتژی ثابت میکند که…

راهنمای عملی خانواده مدلهای SmolLM2 تفاوتهای حیاتی بین مدلهای بنیادی، تنظیمشده برای دستورات و مدلهای گفتگو-محور را بررسی میکند. درک این سه مرحله آموزشی توضیح میدهد چرا یک…

انویدیا ابزار cuTile Rust را معرفی کرد تا برنامهنویسان بتوانند کرنلهای GPU را با امنیت حافظه و بدون ریسک Data Race بنویسند. این سیستم عملکردی نزدیک به cuBLAS دارد اما خطاهای…

مایکروسافت برای کنترل هزینههای سرسامگیر کاربران حرفهای، مدل قیمتگذاری Copilot Cowork را از اشتراک ثابت به پرداخت بر اساس میزان مصرف تغییر میدهد. این شرکت همچنین احتمالاً از…
کیبوردهای پیشفرض اندروید برای تغذیه قابلیتهای هوش مصنوعی، دادههای کاربر را جمعآوری میکنند. کاربران میتوانند یا تنظیمات حریم خصوصی Gboard را سختگیرانه کنند یا به جایگزینهای…

راهنمای فنی جدیدی نحوه استقرار Jina Serve را روی اوبونتو ۲۴.۰۴ آموزش میدهد. این سیستم با ترکیب Docker Compose و Traefik، دسترسی امن HTTPS و پردازش دستهای پویا را برای برنامههای…

راهنمای جامع استقرار پلتفرم متنباز Label Studio روی اوبونتو ۲۴.۰۴ با استفاده از Docker Compose. این متد با بهرهگیری از Traefik، دسترسی امن HTTPS و ذخیرهسازی پایدار دادهها را…

یک مهندس هوش مصنوعی با جایگزینی اشتراکهای ماهانه ابزارهای ویدیو با یک گردشکار خودمیزبان در n8n، هزینههای سالانه را به شدت کاهش داد. این سیستم تولید سناریو، تأمین محتوا و تدوین…

دولت آمریکا دسترسی خارجی به مدلهای پیشرفته Anthropic را به دلیل مخاطرات امنیتی مسدود کرد. با این حال، کارشناسان هشدار میدهند که محدود کردن یک شرکت بیفایده است، زیرا قابلیتهای…

پژوهشگران با معرفی معماری NAG مانع از زوال سیگنال در مدلهای ترنسفورمر میشوند. این رویکرد با جداسازی اندازه از جهت در جریان باقیمانده، امکان ایجاد مدلهای بسیار عمیق و بهینه را…

پژوهشگران چارچوب VinQA را برای ارزیابی توانایی مدلهای هوش مصنوعی در استناد دقیق به عناصر بصری (جداول و نمودارها) در پاسخهای طولانی معرفی کردند. نتایج نشان میدهد تنظیم دقیق…