پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

ساخت ترنسفورمرهای کم‌حافظه با xFormers: دنباله‌های فشرده، GQA، ALiBi، SwiGLU و توجه علی
آموزش کاربردی

درون مکانیزم GQA و توالی‌های فشرده برای ارتقای کارایی مدل‌های هوش مصنوعی

کتابخانه‌ی xFormers با جایگزینی محاسبات سنگین ماتریسی با هسته‌های بهینه، مصرف حافظه‌ی GPU را برای مدل‌های با پنجره‌های متنی بلند به شدت کاهش می‌دهد. این ابزار با پیاده‌سازی…

۶ دقیقه خواندن
کاهش ۶۰٪ هزینه API هوش مصنوعی: تحلیل داده‌محور روش‌ها
آموزش کاربردی

مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

یک توسعه‌دهنده با انتقال کارهای ساده به مدل‌های ارزان‌قیمت و رزرو مدل‌های سطح‌بالا برای پرس‌وجوهای پیچیده، صورت‌حساب ماهانه OpenAI خود را ۶۰٪ کاهش داد. این استراتژی ثابت می‌کند که…

۷ دقیقه خواندن۱
سه پاسخ متفاوت از مدل‌های پایه، دستورپذیر و گفتگویی به یک پرسش واحد
آموزش کاربردی

تأثیر ۳ سطح آموزش بر تبدیل تکمیل‌کننده متن به دستیار هوشمند

راهنمای عملی خانواده مدل‌های SmolLM2 تفاوت‌های حیاتی بین مدل‌های بنیادی، تنظیم‌شده برای دستورات و مدل‌های گفتگو-محور را بررسی می‌کند. درک این سه مرحله آموزشی توضیح می‌دهد چرا یک…

۶ دقیقه خواندن۲
دو روش برای جلوگیری از ردیابی کیبورد اندروید
آموزش کاربردی

گزارش حریم‌خصوصی: ۲ راهکار برای مهار جمع‌آوری داده‌های Gboard

کیبوردهای پیش‌فرض اندروید برای تغذیه قابلیت‌های هوش مصنوعی، داده‌های کاربر را جمع‌آوری می‌کنند. کاربران می‌توانند یا تنظیمات حریم خصوصی Gboard را سخت‌گیرانه کنند یا به جایگزین‌های…

۴ دقیقه خواندن۱
جایگزینی اشتراک ۲۰۰ دلاری با یک راهکار ۲۰ دلاری یک‌بار پرداخت
آموزش کاربردیتأییدنشده · منبع منفرد

«جایگزینی اشتراکی با خودمیزبان»؛ راهکار کاهش هزینه‌های تدوین ویدیو

یک مهندس هوش مصنوعی با جایگزینی اشتراک‌های ماهانه ابزارهای ویدیو با یک گردش‌کار خودمیزبان در n8n، هزینه‌های سالانه را به شدت کاهش داد. این سیستم تولید سناریو، تأمین محتوا و تدوین…

۳ دقیقه خواندن
هوش مصنوعی خطرناک در راه است، فارغ از هر اقدامی

مدل‌های بازمتن اثربخشیِ محدودیت‌های صادراتی آمریکا را کاهش دادند

دولت آمریکا دسترسی خارجی به مدل‌های پیشرفته Anthropic را به دلیل مخاطرات امنیتی مسدود کرد. با این حال، کارشناسان هشدار می‌دهند که محدود کردن یک شرکت بی‌فایده است، زیرا قابلیت‌های…

۴ دقیقه خواندن
چرا افزودن لایه‌های بیشتر در مدل‌های عمیق دیگر جواب نمی‌دهد؟

جریان باقی‌مانده در برابر NAG: گذار به مدل‌های بهینه‌تر و عمیق‌تر

پژوهشگران با معرفی معماری NAG مانع از زوال سیگنال در مدل‌های ترنسفورمر می‌شوند. این رویکرد با جداسازی اندازه از جهت در جریان باقی‌مانده، امکان ایجاد مدل‌های بسیار عمیق و بهینه را…

۲ دقیقه خواندن
چرا مدل‌های چندوجهی در استناد به تصاویر اسناد طولانی شکست می‌خورند؟

چرا مدل‌های چندوجهی در استناد به تصاویر اسناد طولانی شکست می‌خورند؟

پژوهشگران چارچوب VinQA را برای ارزیابی توانایی مدل‌های هوش مصنوعی در استناد دقیق به عناصر بصری (جداول و نمودارها) در پاسخ‌های طولانی معرفی کردند. نتایج نشان می‌دهد تنظیم دقیق…

۲ دقیقه خواندن