موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

LEVI: نتایج بهتر ADRS با کسری از هزینه | ADRS — پژوهش مبتنی بر هوش مصنوعی برای سیستم‌ها

سامانه LEVI: کاهش ۶.۷ برابری هزینه‌ها با اتوماسیون کشف الگوریتم

سامانه LEVI با اتوماسیون کشف الگوریتم‌های سیستمی، هزینه‌های عملیاتی را ۳ تا ۷ برابر کاهش داده و در عین حال به نتایج پیشرو (SOTA) رسیده است. این مدل با تفکیک وظایف بین مدل‌های کوچک…

۱۲ دقیقه خواندن

گزارش: دولت آمریکا متا را به اشتراک‌گذاری مدل‌های هوش مصنوعی تشویق می‌کند

اخبار کوتاه روزانه۴ روز پیش

«اشتراک‌گذاری مدل‌ها برای امنیت»؛ درخواست واشنگتن از متا

دولت ایالات متحده از شرکت متا می‌خواهد مدل‌های خود را برای شناسایی نقاط ضعف امنیتی تحویل دهد. متا تنها شرکت بزرگ توسعه‌دهنده است که هنوز با این درخواست‌های داوطلبانه همکاری نکرده…

۲ دقیقه خواندن

مدیرعامل پانگرام: مدل‌های زبانی با تکرار استدلال‌های یکسان خود را لو می‌دهند

داستان‌ها و مصاحبه‌ها۴ روز پیش

خوشه‌های منطقی: ردپای پنهان هوش مصنوعی در ساختار استدلال‌ها

مدیرعامل شرکت Pangram معتقد است مدل‌های زبانی با وجود تسلط بر دستور زبان، فاقد تنوع استدلالی انسان‌ها هستند. این ابزار تشخیص AI از طریق شناسایی الگوهای ساختاری و محدود بودن طیف…

۱ دقیقه خواندن

DFlash: پیش‌نویسی بلوک‌های کامل توکن به صورت موازی برای افزایش ۱۵ برابری توان عملیاتی در پردازنده‌های انویدیا بلک‌ول

تحلیل و بررسی تخصصی۴ روز پیش

روش DFlash توان عملیاتی تراشه‌های Blackwell انویدیا را ۱۵ برابر کرد

پژوهشگران دانشگاه سن‌دیگو با معرفی DFlash، رمزگشایی گمانه‌زنانه را از حالت تک‌به‌تک به بلوک‌های موازی تغییر دادند. این متد بدون کاهش کیفیت خروجی، سرعت استنتاج را در سخت‌افزارهای…

۵ دقیقه خواندن

زندگی با AI۴ روز پیش

۷ چت‌بات برتر ۲۰۲۶؛ انتخاب مدل بر اساس گردش‌کار کاربر

یک بررسی جامع در سال ۲۰۲۶ رتبه‌بندی هفت چت‌بات برتر را بر اساس کاربرد واقعی جایگزین تبلیغات کرد. در حالی که ChatGPT همچنان پیشتاز کاربردهای عمومی است، ابزارهایی مثل Claude و…

۲ دقیقه خواندن۳

عوامل هوشمند در محیط شبیه‌سازی شده Qwen-AgentWorld در حال تعامل و انجام وظایف پیچیده هستند.

تحلیل و بررسی تخصصی۴ روز پیش

شبیه‌سازی محیط‌های پیچیده با زنجیره تفکر بلند در Qwen-AgentWorld

پژوهشگران مجموعه‌ای از مدل‌های جهانی زبان به نام Qwen-AgentWorld را معرفی کردند که قادر به شبیه‌سازی محیط‌های عامل‌محور در هفت دامنه مختلف است. این مدل‌ها با پیش‌بینی دینامیک محیط…

۲ دقیقه خواندن

نمایش ساختار Sparse Attention در مدل MiniMax M3: کاهش پیچیدگی محاسباتی از O(n²) به O(n) با استفاده از انتخاب هوشمندانه توکن‌ه

تحلیل و بررسی تخصصی۴ روز پیش

«بهینه‌سازی استنتاج طولانی»؛ هدف اصلی در طراحی مدل وزن‌باز M3

مدل وزن‌باز M3 با پنجره متنی یک میلیون توکنی و قابلیت‌های چندوجهی معرفی شد. این مدل با استفاده از معماری توجه پراکنده (MSA)، هزینه محاسباتی استنتاج در متون طولانی را به‌شدت کاهش…

۴ دقیقه خواندن

کد عدد اشتباه را گرفت. من باید داستان اشتباه را می‌گرفتم.

آموزش کاربردی۴ روز پیش

پروتکل لایه‌بندی شواهد؛ راهکار جدید برای توقف توهمات روایتی در سیستم‌های

یک چارچوب ساختاری جدید برای سیستم‌های معاملاتی هوش مصنوعی، «اعداد بد» (خطاهای عددی) را از «روایت‌های بد» (ادعاهای بدون دلیل) تفکیک می‌کند. این پروتکل از ارتقای سطح ادعاها به…

۶ دقیقه خواندن

یادگیری تقویتی با پاداش‌های قابل تأیید: چرا هوش مصنوعی دارد خودش تکالیفش را تصحیح می‌کند

آموزش کاربردی۵ روز پیش

پژوهش RLVR: جایگزینی بازخوردهای انسانی با تست‌های واحد در کدنویسی

یادگیری تقویتی با پاداش‌های قابل‌تأیید (RLVR) جایگزین بازخوردهای گران‌قیمت انسانی شده و از تست‌های واحد و اثبات‌های ریاضی برای آموزش مدل‌ها استفاده می‌کند. این سازوکار اجازه…

۶ دقیقه خواندن

سرگرمی و خلاقیت۵ روز پیش

پشته اهداف در برابر مدل‌های پیچیده هوش مصنوعی در FromSoftware

تحلیل کدهای Elden Ring نشان می‌دهد FromSoftware به‌جای استفاده از مدل‌های پیچیده هوش مصنوعی، از یک سیستم «پشته اهداف» (Goal Stack) برای کنترل دقیق رفتار باس‌ها استفاده می‌کند. این…

۱۰ دقیقه خواندن

ضبط یک مهارت: فردی در حال فیلمبرداری از آموزش انجام کاری با گوشی روی سه‌پایه

اخبار کوتاه روزانه۵ روز پیش

درون Record & Replay؛ مسیری برای جایگزینی دستورات متنی با الگوهای رفتاری

شرکت Codex قابلیت Record & Replay را معرفی کرد تا نمایش‌های دستی کاربر از یک تسک را به مهارت‌های هوش مصنوعی تبدیل کند. این تغییر، مسیر حرکت از پرامپت‌های متنی ساده به سمت…

۴ دقیقه خواندن

ساخت اپلیکیشن‌های عامل‌محور واقعی با CUGA: دوازده نمونه کاربردی روی چارچوب سبک

آموزش کاربردی۵ روز پیش

CUGA چگونه پیوند ابزارهای محلی و MCP را در عامل‌ها تسهیل می‌کند؟

شرکت IBM ابزار متن‌باز CUGA را برای جایگزینی مدیریت دستی زیرساخت با یک سیستم پیکربندی‌شده برای برنامه‌ریزی و کنترل وضعیت عرضه کرد. این ابزار به توسعه‌دهندگان اجازه می‌دهد…

۱۴ دقیقه خواندن