موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

ساخت ترنسفورمرهای کم‌حافظه با xFormers: دنباله‌های فشرده، GQA، ALiBi، SwiGLU و توجه علی

درون مکانیزم GQA و توالی‌های فشرده برای ارتقای کارایی مدل‌های هوش مصنوعی

کتابخانه‌ی xFormers با جایگزینی محاسبات سنگین ماتریسی با هسته‌های بهینه، مصرف حافظه‌ی GPU را برای مدل‌های با پنجره‌های متنی بلند به شدت کاهش می‌دهد. این ابزار با پیاده‌سازی…

۶ دقیقه خواندن

کاهش ۶۰٪ هزینه API هوش مصنوعی: تحلیل داده‌محور روش‌ها

آموزش کاربردی۲ هفته پیش

مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

یک توسعه‌دهنده با انتقال کارهای ساده به مدل‌های ارزان‌قیمت و رزرو مدل‌های سطح‌بالا برای پرس‌وجوهای پیچیده، صورت‌حساب ماهانه OpenAI خود را ۶۰٪ کاهش داد. این استراتژی ثابت می‌کند که…

۷ دقیقه خواندن۱

سه پاسخ متفاوت از مدل‌های پایه، دستورپذیر و گفتگویی به یک پرسش واحد

آموزش کاربردی۲ هفته پیش

تأثیر ۳ سطح آموزش بر تبدیل تکمیل‌کننده متن به دستیار هوشمند

راهنمای عملی خانواده مدل‌های SmolLM2 تفاوت‌های حیاتی بین مدل‌های بنیادی، تنظیم‌شده برای دستورات و مدل‌های گفتگو-محور را بررسی می‌کند. درک این سه مرحله آموزشی توضیح می‌دهد چرا یک…

۶ دقیقه خواندن۲

cuTile Rust یک DSL ایمن مبتنی بر کاشی برای برنامه‌نویسی هسته به زبان Rust است که API ایمن میزبان برای ارسال تنسورها به توابع

آموزش کاربردی۲ هفته پیش

ان‌ویدیا: cuTile Rust خطاهای حافظه را در ۹۲٪ عملکرد پیک حذف می‌کند

ان‌ویدیا ابزار cuTile Rust را معرفی کرد تا برنامه‌نویسان بتوانند کرنل‌های GPU را با امنیت حافظه و بدون ریسک Data Race بنویسند. این سیستم عملکردی نزدیک به cuBLAS دارد اما خطاهای…

۵ دقیقه خواندن

همکار هوش مصنوعی مایکروسافت به پرداخت بر اساس مصرف رفت و احتمالاً از دیپ‌سیک استفاده می‌کند

اخبار کوتاه روزانه۲ هفته پیش

اشتراک ثابت در برابر پرداخت بر اساس مصرف در Copilot Cowork

مایکروسافت برای کنترل هزینه‌های سرسام‌گیر کاربران حرفه‌ای، مدل قیمت‌گذاری Copilot Cowork را از اشتراک ثابت به پرداخت بر اساس میزان مصرف تغییر می‌دهد. این شرکت همچنین احتمالاً از…

۱ دقیقه خواندن۱

دو روش برای جلوگیری از ردیابی کیبورد اندروید

آموزش کاربردی۲ هفته پیش

گزارش حریم‌خصوصی: ۲ راهکار برای مهار جمع‌آوری داده‌های Gboard

کیبوردهای پیش‌فرض اندروید برای تغذیه قابلیت‌های هوش مصنوعی، داده‌های کاربر را جمع‌آوری می‌کنند. کاربران می‌توانند یا تنظیمات حریم خصوصی Gboard را سخت‌گیرانه کنند یا به جایگزین‌های…

۴ دقیقه خواندن۱

استقرار چارچوب جستجوی عصبی Jina Serve روی Ubuntu 24.04

آموزش کاربردی۲ هفته پیش

«دسترسی امن و پویا»؛ هدف Jina Serve از ادغام Traefik و داکر

راهنمای فنی جدیدی نحوه استقرار Jina Serve را روی اوبونتو ۲۴.۰۴ آموزش می‌دهد. این سیستم با ترکیب Docker Compose و Traefik، دسترسی امن HTTPS و پردازش دسته‌ای پویا را برای برنامه‌های…

۳ دقیقه خواندن

استقرار پلتفرم متن‌باز برچسب‌زنی داده Label Studio روی Ubuntu 24.04

آموزش کاربردی۲ هفته پیش

راهنمای فنی: یکپارچه‌سازی Label Studio با اوبونتو ۲۴.۰۴ از طریق داکر

راهنمای جامع استقرار پلتفرم متن‌باز Label Studio روی اوبونتو ۲۴.۰۴ با استفاده از Docker Compose. این متد با بهره‌گیری از Traefik، دسترسی امن HTTPS و ذخیره‌سازی پایدار داده‌ها را…

۲ دقیقه خواندن۱

جایگزینی اشتراک ۲۰۰ دلاری با یک راهکار ۲۰ دلاری یک‌بار پرداخت

آموزش کاربردی۲ هفته پیشتأییدنشده · منبع منفرد

«جایگزینی اشتراکی با خودمیزبان»؛ راهکار کاهش هزینه‌های تدوین ویدیو

یک مهندس هوش مصنوعی با جایگزینی اشتراک‌های ماهانه ابزارهای ویدیو با یک گردش‌کار خودمیزبان در n8n، هزینه‌های سالانه را به شدت کاهش داد. این سیستم تولید سناریو، تأمین محتوا و تدوین…

۳ دقیقه خواندن

هوش مصنوعی خطرناک در راه است، فارغ از هر اقدامی

اخبار کوتاه روزانه۲ هفته پیش

مدل‌های بازمتن اثربخشیِ محدودیت‌های صادراتی آمریکا را کاهش دادند

دولت آمریکا دسترسی خارجی به مدل‌های پیشرفته Anthropic را به دلیل مخاطرات امنیتی مسدود کرد. با این حال، کارشناسان هشدار می‌دهند که محدود کردن یک شرکت بی‌فایده است، زیرا قابلیت‌های…

۴ دقیقه خواندن

چرا افزودن لایه‌های بیشتر در مدل‌های عمیق دیگر جواب نمی‌دهد؟

تحلیل و بررسی تخصصی۲ هفته پیش

جریان باقی‌مانده در برابر NAG: گذار به مدل‌های بهینه‌تر و عمیق‌تر

پژوهشگران با معرفی معماری NAG مانع از زوال سیگنال در مدل‌های ترنسفورمر می‌شوند. این رویکرد با جداسازی اندازه از جهت در جریان باقی‌مانده، امکان ایجاد مدل‌های بسیار عمیق و بهینه را…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا مدل‌های چندوجهی در استناد به تصاویر اسناد طولانی شکست می‌خورند؟

پژوهشگران چارچوب VinQA را برای ارزیابی توانایی مدل‌های هوش مصنوعی در استناد دقیق به عناصر بصری (جداول و نمودارها) در پاسخ‌های طولانی معرفی کردند. نتایج نشان می‌دهد تنظیم دقیق…

۲ دقیقه خواندن