موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

بنچمارک ITBench-AA: نرخ موفقیت مدل‌های پیشرو در وظایف SRE کمتر از ۵۰٪ است

یک بنچمارک جدید از IBM و Artificial Analysis نشان می‌دهد که پیشرفته‌ترین مدل‌های هوش مصنوعی در عیب‌یابی زیرساخت‌های سازمانی شکست می‌خورند. یافته‌ها حاکی از یک رابطه معکوس…

۳ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

چگونه TokenSpeed سرعت استنتاج Qwen3.5 را به ۵۸۰ توکن در ثانیه رساند؟

موتور استنتاج TokenSpeed با بهینه‌سازی حافظه و ادغام کرنل‌ها، رکورد ۵۸۰ توکن در ثانیه را برای مدل Qwen3.5-397B روی پردازنده‌های NVIDIA Blackwell ثبت کرد. این پیشرفت به‌ویژه برای…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

Reachy Mini و حذف APIهای ابری: استقرار محلی زنجیره کامل تبدیل گفتار به گفتار

ربات Reachy Mini اکنون می‌تواند تمام مراحل تبدیل گفتار به گفتار را به‌صورت محلی اجرا کند. این تغییر نیاز به سرورهای ابری و کلیدهای API را حذف کرده و حریم خصوصی کامل و هزینه صفر…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه همگام‌سازی دلتای پراکنده حجم انتقال داده در آموزش RL را ۹۸٪ کاهش داد؟

کتابخانه TRL متعلق به Hugging Face اکنون از همگام‌سازی وزن‌های دلتا پشتیبانی می‌کند. این قابلیت با ارسال تنها پارامترهای تغییریافته، نیاز به پهنای باند را به شدت کاهش داده و…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

چرا علی‌بابا برای کاهش هزینه‌ی استنتاج، روی بنیاد PyTorch شرط‌بندی کرد؟

علی‌بابا کلاود برای بهینه‌سازی زیرساخت‌های هوش مصنوعی در سخت‌افزارهای مختلف، به عضویت پلاتینیوم بنیاد PyTorch درآمد. این اقدام به شرکت اجازه می‌دهد تا با حضور در هیئت‌مدیره،…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه ۵۰ خط کد C# محدودیت مدل‌های OpenAI را در Codex CLI شکست داد؟

یک اسکریپت C# با استفاده از SDK ابزار Cadenza.Agent، امکان اتصال Codex CLI به مدل‌هایی مثل Claude 3.5 و Llama را فراهم می‌کند. این روش با ایجاد یک پروکسی برای APIهای OpenAI،…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

گزارش vLLM: افزایش ۲ برابری سرعت تولید متن در مدل Kimi K2.6 با EAGLE 3.1

EAGLE 3.1 با رفع مشکل «لغزش توجه»، سرعت استنتاج مدل‌های زبانی را به‌ویژه در متون طولانی به‌شدت افزایش می‌دهد. این به‌روزرسانی در مدل Kimi K2.6 توانست نرخ خروجی را تا ۲ برابر بهبود…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه Open-MM-RL توهمات ریاضی در مدل‌های چندوجهی را حذف می‌کند؟

یک خط لوله (Pipeline) جدید برای آموزش مدل‌های بینایی-زبانی معرفی شده است که به جای تکیه بر حدس‌های هوش مصنوعی، از اثبات‌های ریاضی برای پاداش‌دهی استفاده می‌کند. این روش با ترکیب…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

Qwen3-ASR: کاهش نرخ خطای تبدیل صوت به متن از ۷.۴٪ به ۱.۸۴٪

نرم‌افزار Brethof Voice Pro 2.0 با استفاده از مدل‌های Qwen3-ASR و Hunyuan-MT2، امکان تبدیل و ترجمه صوت را به‌صورت کاملاً محلی فراهم کرد. این سیستم در بنچمارک‌ها از Whisper…

۲ دقیقه خواندن

زندگی با AIماه گذشته

چرا کمتر از ۱۰ درصد کدهای هوش مصنوعی در پروژه Pi پذیرفته می‌شوند؟

پروژه Pi با موجی از کدهای بی‌کیفیت و گزارش‌های خطای ساختگی توسط هوش مصنوعی مواجه شده است. مدیران این پروژه اکنون ابزارهای ویژه‌ای ساخته‌اند تا توهمات مدل‌های زبانی را که با…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

بایت‌دنس: مدل ۳ میلیارد پارامتری Lance با امتیاز ۸۵.۱۱ در بنچمارک VBench

بایت‌دنس مدل Lance را معرفی کرد؛ یک مدل ۳ میلیارد پارامتری که تولید، ویرایش و درک تصویر و ویدیو را در یک چارچوب واحد جمع می‌کند. این مدل با بهره‌وری بالا، در بنچمارک‌های کلیدی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

توقف زودهنگام آموزش: راهکاری برای حذف ۷۱ درصدی رفتارهای مخرب در مدل‌های زبانی

پژوهشی از دانشگاه عبری اورشلیم نشان می‌دهد رفتارهای «سرکشانه» در مدل‌های هوش مصنوعی، بیش از آنکه به داده‌ها مربوط باشد، نتیجه‌ی آموزش بیش از حد (Overtraining) است. با توقف…

۳ دقیقه خواندن