پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

گوگل: مدل Gemma 4 با دقت ۸۹.۲ درصدی در بنچمارک AIME، استدلال ریاضی را محلی کرد
آموزش کاربردی

گوگل: مدل Gemma 4 با دقت ۸۹.۲ درصدی در بنچمارک AIME، استدلال ریاضی را محلی کرد

گوگل دیپ‌مایند خانواده مدل‌های Gemma 4 را با وزن‌های باز عرضه کرد تا استدلال سطح پیشرو را به سخت‌افزارهای محلی بیاورد. مدل ۳۱ میلیارد پارامتری این خانواده، جهشی خیره‌کننده در…

۲ دقیقه خواندن
چگونه نقص‌های متادیتای GGUF سرعت استقرار مدل‌های محلی را کاهش می‌دهد؟
آموزش کاربردی

چگونه نقص‌های متادیتای GGUF سرعت استقرار مدل‌های محلی را کاهش می‌دهد؟

فرمت GGUF با یکپارچه‌سازی وزن‌ها و متادیتا، استقرار مدل‌های محلی را ساده کرده است. با این حال، نبود استانداردی برای فراخوانی ابزارها و توکن‌های استدلالی، توسعه‌دهندگان را مجبور به…

۲ دقیقه خواندن
Nous Research: کاهش ۲.۵ برابری زمان پیش‌آموزش LLM بدون تغییر در معماری

Nous Research: کاهش ۲.۵ برابری زمان پیش‌آموزش LLM بدون تغییر در معماری

پژوهشکده Nous Research روشی به نام آموزش برهم‌نهی توکن‌ها (TST) را معرفی کرده که سرعت پیش‌آموزش مدل‌های زبانی بزرگ را تا ۲.۵ برابر افزایش می‌دهد. این متد با پردازش دسته‌ای توکن‌ها…

۳ دقیقه خواندن
کاهش ۳۲ درصدی زمان رفع خرابی در امریکن اکسپرس با استفاده از عامل‌های هوش مصنوعی
آموزش کاربردی

کاهش ۳۲ درصدی زمان رفع خرابی در امریکن اکسپرس با استفاده از عامل‌های هوش مصنوعی

تیم‌های SRE در حال گذار از تحلیل ساده‌ی هشدارها به «بررسی عامل‌محور» هستند؛ سیستمی که در آن هوش مصنوعی برای یافتن علت ریشه‌ای خطا، مستقیماً ابزارهای زیرساختی را اجرا می‌کند. این…

۲ دقیقه خواندن
بهینه‌سازی Gemma 4 در لبه: جایگزینی تنظیم دقیق با سیستم امتیازدهی خودکار
آموزش کاربردی

بهینه‌سازی Gemma 4 در لبه: جایگزینی تنظیم دقیق با سیستم امتیازدهی خودکار

توسعه‌دهندگان می‌توانند به‌جای تنظیم دقیق هزینه‌بر، از یک مدل بزرگ‌تر برای تولید و امتیازدهی به پرامپت‌های مدل‌های لبه استفاده کنند. این روش «ارتقای مهارت پرامپت» پایداری سیستم را…

۲ دقیقه خواندن