پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

LEVI: نتایج بهتر ADRS با کسری از هزینه | ADRS — پژوهش مبتنی بر هوش مصنوعی برای سیستم‌ها
آموزش کاربردی

سامانه LEVI: کاهش ۶.۷ برابری هزینه‌ها با اتوماسیون کشف الگوریتم

سامانه LEVI با اتوماسیون کشف الگوریتم‌های سیستمی، هزینه‌های عملیاتی را ۳ تا ۷ برابر کاهش داده و در عین حال به نتایج پیشرو (SOTA) رسیده است. این مدل با تفکیک وظایف بین مدل‌های کوچک…

۱۲ دقیقه خواندن
گزارش: دولت آمریکا متا را به اشتراک‌گذاری مدل‌های هوش مصنوعی تشویق می‌کند

«اشتراک‌گذاری مدل‌ها برای امنیت»؛ درخواست واشنگتن از متا

دولت ایالات متحده از شرکت متا می‌خواهد مدل‌های خود را برای شناسایی نقاط ضعف امنیتی تحویل دهد. متا تنها شرکت بزرگ توسعه‌دهنده است که هنوز با این درخواست‌های داوطلبانه همکاری نکرده…

۲ دقیقه خواندن
مدیرعامل پانگرام: مدل‌های زبانی با تکرار استدلال‌های یکسان خود را لو می‌دهند

خوشه‌های منطقی: ردپای پنهان هوش مصنوعی در ساختار استدلال‌ها

مدیرعامل شرکت Pangram معتقد است مدل‌های زبانی با وجود تسلط بر دستور زبان، فاقد تنوع استدلالی انسان‌ها هستند. این ابزار تشخیص AI از طریق شناسایی الگوهای ساختاری و محدود بودن طیف…

۱ دقیقه خواندن
DFlash: پیش‌نویسی بلوک‌های کامل توکن به صورت موازی برای افزایش ۱۵ برابری توان عملیاتی در پردازنده‌های انویدیا بلک‌ول

روش DFlash توان عملیاتی تراشه‌های Blackwell انویدیا را ۱۵ برابر کرد

پژوهشگران دانشگاه سن‌دیگو با معرفی DFlash، رمزگشایی گمانه‌زنانه را از حالت تک‌به‌تک به بلوک‌های موازی تغییر دادند. این متد بدون کاهش کیفیت خروجی، سرعت استنتاج را در سخت‌افزارهای…

۵ دقیقه خواندن
عوامل هوشمند در محیط شبیه‌سازی شده Qwen-AgentWorld در حال تعامل و انجام وظایف پیچیده هستند.

شبیه‌سازی محیط‌های پیچیده با زنجیره تفکر بلند در Qwen-AgentWorld

پژوهشگران مجموعه‌ای از مدل‌های جهانی زبان به نام Qwen-AgentWorld را معرفی کردند که قادر به شبیه‌سازی محیط‌های عامل‌محور در هفت دامنه مختلف است. این مدل‌ها با پیش‌بینی دینامیک محیط…

۲ دقیقه خواندن
نمایش ساختار Sparse Attention در مدل MiniMax M3: کاهش پیچیدگی محاسباتی از O(n²) به O(n) با استفاده از انتخاب هوشمندانه توکن‌ه

«بهینه‌سازی استنتاج طولانی»؛ هدف اصلی در طراحی مدل وزن‌باز M3

مدل وزن‌باز M3 با پنجره متنی یک میلیون توکنی و قابلیت‌های چندوجهی معرفی شد. این مدل با استفاده از معماری توجه پراکنده (MSA)، هزینه محاسباتی استنتاج در متون طولانی را به‌شدت کاهش…

۴ دقیقه خواندن
کد عدد اشتباه را گرفت. من باید داستان اشتباه را می‌گرفتم.
آموزش کاربردی

پروتکل لایه‌بندی شواهد؛ راهکار جدید برای توقف توهمات روایتی در سیستم‌های

یک چارچوب ساختاری جدید برای سیستم‌های معاملاتی هوش مصنوعی، «اعداد بد» (خطاهای عددی) را از «روایت‌های بد» (ادعاهای بدون دلیل) تفکیک می‌کند. این پروتکل از ارتقای سطح ادعاها به…

۶ دقیقه خواندن
یادگیری تقویتی با پاداش‌های قابل تأیید: چرا هوش مصنوعی دارد خودش تکالیفش را تصحیح می‌کند
آموزش کاربردی

پژوهش RLVR: جایگزینی بازخوردهای انسانی با تست‌های واحد در کدنویسی

یادگیری تقویتی با پاداش‌های قابل‌تأیید (RLVR) جایگزین بازخوردهای گران‌قیمت انسانی شده و از تست‌های واحد و اثبات‌های ریاضی برای آموزش مدل‌ها استفاده می‌کند. این سازوکار اجازه…

۶ دقیقه خواندن