پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۴ مقاله منتشر شده

رمزگشایی از Trooper؛ ابزاری برای نجات حافظه‌ی هوش مصنوعی در لحظه‌ی بحران
آموزش کاربردی

رمزگشایی از Trooper؛ ابزاری برای نجات حافظه‌ی هوش مصنوعی در لحظه‌ی بحران

ابزار Trooper با ایجاد یک پروکسی سبک، مشکل قطع شدن گفتگوها هنگام اتمام سهمیه (Quota) مدل‌های ابری را حل می‌کند. این ابزار با استراتژی فشرده‌سازی سه‌لایه، بافت گفتگو را هنگام…

۲ دقیقه خواندن
چرا Mistral برای شکست دادن رقبای MoE، دوباره به مدل‌های متراکم روی آورد؟

چرا Mistral برای شکست دادن رقبای MoE، دوباره به مدل‌های متراکم روی آورد؟

مدل Mistral Medium 3.5 با ۱۲۸ میلیارد پارامتر، مرز بین مدل‌های استدلالی و کدنویسی را از بین برد. این مدل متراکم، پایداری عملیاتی را جایگزین تخصص‌های پراکنده کرد تا یک ابزار…

۳ دقیقه خواندن
پایان کابوس مهندسی دستی در آموزش مدل‌های با کانتکست بلند

پایان کابوس مهندسی دستی در آموزش مدل‌های با کانتکست بلند

پایتورچ با معرفی AutoSP، فرآیند پیچیده‌ی موازی‌سازی توالی‌ها را خودکار کرد. این ابزار اجازه می‌دهد مدل‌های زبانی بزرگ با کانتکست‌های ۱۰۰ هزار توکنی بدون نیاز به بازنویسی دستی کد…

۲ دقیقه خواندن
گزارش IBM: مدل ۸ میلیاردی Granite 4.1 مدل‌های ۳۲ میلیاردی MoE را شکست داد

گزارش IBM: مدل ۸ میلیاردی Granite 4.1 مدل‌های ۳۲ میلیاردی MoE را شکست داد

شرکت IBM با معرفی خانواده مدل‌های Granite 4.1 ثابت کرد که مهندسی دقیق داده می‌تواند جایگزین حجم عظیم پارامترها شود. مدل ۸ میلیارد پارامتری این مجموعه، با تکیه بر کیفیت داده،…

۳ دقیقه خواندن