تحلیل و بررسی تخصصی

چگونه TLX Block Attention با حذف سربارهای الگوریتمی، سرعت B200 را ۲.۵ برابر کرد؟

پژوهشگران پایتورچ با توسعه یک کرنل تخصصی در Triton، سرعت گذر بازگشتی در توجه بلوکی-قطری را برای پردازنده‌های B200 تا ۲.۵ برابر افزایش دادند. این بهینه‌سازی با حذف ذخیره‌سازی…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

لنسِت: نرخ ارجاعات جعلی هوش مصنوعی در مقالات پزشکی ۱۲ برابر شد

بررسی ۲.۵ میلیون مقاله زیست‌پزشکی نشان می‌دهد که ارجاعات جعلی در متون علمی به شدت افزایش یافته است. این روند به‌ویژه در مقالات مروری که پایه درمان بیماران هستند، بحرانی شده و…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

گزارش vLLM: افزایش ۲ برابری سرعت تولید متن در مدل Kimi K2.6 با EAGLE 3.1

EAGLE 3.1 با رفع مشکل «لغزش توجه»، سرعت استنتاج مدل‌های زبانی را به‌ویژه در متون طولانی به‌شدت افزایش می‌دهد. این به‌روزرسانی در مدل Kimi K2.6 توانست نرخ خروجی را تا ۲ برابر بهبود…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

چگونه Cursor با بازخورد متنی، سیگنال یادگیری عامل‌های خود را ۲۰۰۰ برابر کرد؟

نسخه Cursor Composer 2.5 با معرفی یادگیری تقویت‌شده مبتنی بر بازخورد متنی هدفمند، مشکل «تخصیص اعتبار» در جلسات طولانی را حل کرده است. این روش با جایگزینی پاداش‌های کلی با…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه Open-MM-RL توهمات ریاضی در مدل‌های چندوجهی را حذف می‌کند؟

یک خط لوله (Pipeline) جدید برای آموزش مدل‌های بینایی-زبانی معرفی شده است که به جای تکیه بر حدس‌های هوش مصنوعی، از اثبات‌های ریاضی برای پاداش‌دهی استفاده می‌کند. این روش با ترکیب…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

مایکروسافت SkillOpt: کسب رتبه اول در ۵۲ بنچمارک عامل‌های هوش مصنوعی

چارچوب جدید SkillOpt مایکروسافت مهارت‌های عامل‌های هوش مصنوعی را به‌جای تغییر وزن‌های مدل، از طریق توصیفات متنی بهینه می‌کند. این روش در ۵۲ محیط مختلف، نتایجی برابر یا بهتر از…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

چرا اپل برای نجات سیری به مدل ۱.۲ تریلیون پارامتری گوگل روی آورد؟

اپل برای ارتقای سیری از یک مدل سفارشی ۱.۲ تریلیون پارامتری گوگل استفاده می‌کند. این سیستم وظایف را بین پردازش محلی برای کارهای ساده و استنتاج ابری برای درخواست‌های پیچیده تقسیم…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

Qwen3-ASR: کاهش نرخ خطای تبدیل صوت به متن از ۷.۴٪ به ۱.۸۴٪

نرم‌افزار Brethof Voice Pro 2.0 با استفاده از مدل‌های Qwen3-ASR و Hunyuan-MT2، امکان تبدیل و ترجمه صوت را به‌صورت کاملاً محلی فراهم کرد. این سیستم در بنچمارک‌ها از Whisper…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

گوگل و NYU: کاهش ۸ برابری حافظه مورد نیاز برای جستجوی برداری بدون آموزش

کتابخانه turbovec با معرفی روشی جدید برای کوانتایز کردن بردارها، مصرف حافظه در سیستم‌های RAG را ۸ برابر کاهش می‌دهد. این فناوری برخلاف روش‌های سنتی، نیازی به داده‌های آموزشی ندارد…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

چرا گلوگاه عملکرد عامل‌های هوش مصنوعی مدل نیست، بلکه مهندسی هارنس است؟

شرکت Hugging Face یک چارچوب فنی برای استانداردسازی مفاهیم عامل‌های هوش مصنوعی معرفی کرد. این مدل با تفکیک مدل از لایه‌های اجرایی، دیدگاهی دقیق برای طراحی و آموزش سیستم‌های…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا دیگر ابزاری به نام «بهترین دستیار کدنویسی» وجود ندارد؟

کدنویسی عامل‌محور در سال ۲۰۲۶ به چهار ابزار تخصصی بر اساس سطح خودمختاری تقسیم شده است. استراتژی برنده دیگر انتخاب یک ابزار واحد نیست، بلکه ترکیب این ابزارها از طریق یک درگاه API…

۲ دقیقه خواندن

اخبار کوتاه روزانهماه گذشته

گوگل دیپ‌مایند: حل ۹ مسئله‌ی باز Erdős با هزینه‌ای کمتر از چندصد دلار

سیستم AlphaProof Nexus گوگل توانست ۹ مسئله‌ی ریاضی دشوار Erdős را با استفاده از یک حلقه‌ی تأیید رسمی حل کند. این دستاورد ثابت می‌کند که عامل‌های ساده‌ی متصل به کامپایلر می‌توانند…

۲ دقیقه خواندن