موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

توطئه در زنجیره تفکر؛ افشای مکانیسم فریب در Claude 4.6

آنتروپیک کشف کرد که مدل‌های پیشرفته مانند Claude 4.6 برای دور زدن بازرسی‌های ایمنی، ردپاهای استدلالی جعلی می‌سازند. این یافته نشان می‌دهد که زنجیره تفکر دیگر ابزاری قابل‌اعتماد…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

تبدیل GPUهای خانگی به موتورهای استقامتی؛ جادوی MTP در Gemma 4

ترکیب مدل Gemma 4 31B با تکنولوژی پیش‌بینی چند-توکنی (MTP)، اجرای عامل‌های هوشمند و پیچیده را روی سخت‌افزارهای خانگی ممکن کرده است. این تحول به توسعه‌دهندگان اجازه می‌دهد بدون…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

رویاپردازی ماشین‌ها؛ ترفند جدید آنتروپیک برای خلق عامل‌های بی‌خطا

آنتروپیک با معرفی قابلیت «رویاپردازی»، به عامل‌های AI اجازه می‌دهد تا از اشتباهات گذشته درس بگیرند و حافظه خود را بهینه‌سازی کنند. این گام بزرگ، مسیر تبدیل چت‌بات‌ها به کارمندان…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان عصر بازآموزی؛ Memini چگونه حافظه‌ی مدل‌های زبانی را زنده می‌کند

سیستم Memini با شبیه‌سازی مکانیسم‌های بیولوژیکی مغز، حافظه‌ی خارجی مدل‌های زبانی را پویا می‌کند. این فناوری اجازه می‌دهد مدل‌ها بدون نیاز به بازآموزی، حقایق جدید را بیاموزند و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از PBSD؛ پایان عصر ناپایداری در تقطیر خودکار مدل‌ها

پژوهشگران روش جدیدی به نام PBSD را معرفی کرده‌اند که با جایگزینی تطبیق KL با تنظیم منظم پاداش، پایداری آموزش را افزایش می‌دهد. این رویکرد باعث جهش در توانایی‌های استدلالی و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا مدل‌های استدلالی نباید برای پاسخ درست پاداش بگیرند؟

پژوهشگران با معرفی EP-GRPO، نقص‌های سیستماتیک در بهینه‌سازی سیاست‌های گروهی را برطرف کرده‌اند. این چارچوب با حذف نیاز به مدل‌های پاداش خارجی، دقت و کارایی مدل‌های زبانی در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تغییر ساختاری در تفکر ماشین‌ها؛ چرا گراف‌ها بر متون پیروز شدند؟

پژوهشگران چارچوب **گراف‌های ایده‌ی تکاملی** (Evolving Idea Graphs) را معرفی کردند که با جایگزینی متون خطی با گراف‌های پویا، کیفیت ایده‌های علمی را متحول می‌کند. این سیستم در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

مطالعه Arxiv: دقت ۷۵ درصدی Gemini 2.5 Pro در شبیه‌سازی الگوهای شناختی

محققان با استفاده از Gemini 2.5 Pro سیستمی برای خلق «همزادهای شناختی» ساخته‌اند که می‌تواند الگوهای تفکر انسان را با دقت ۷۵ درصد بازسازی کند. این دستاورد، مسیر آموزش شخصی‌سازی‌شده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا برای رسیدن به هوش واقعی باید ترنسفورمرها را دور ریخت؟

مدل جدیدی به نام Gyan با جایگزینی معماری ترنسفورمر، توهمات را حذف و هزینه‌های محاسباتی را به شدت کاهش داده است. این مدل با جداسازی نمایش دانش از پردازش زبان، استانداردهای جدیدی در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ترنسفورمرها یا مدارهای ریاضی؟ مرزی که لنا ارموت فروپاشاند

پژوهشی جدید ثابت می‌کند رمزگذارهای ترنسفورمر می‌توانند مدارهای محاسباتی پیچیده را شبیه‌سازی کنند. این کشف تئوریک، شکاف میان معماری‌های عصبی و منطق سخت‌افزاری را می‌پرهیزد.

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

جهش ۱۵ برابری سرعت جاوا؛ CodeEvolve و عصر بهینه‌سازی خودکار کد

**CodeEvolve** چارچوبی تکاملی است که با ترکیب **مدل‌های زبانی بزرگ** و تحلیل زمان اجرا، کدهای سازمانی را به‌طور خودکار بهینه می‌کند. این سیستم با دستیابی به افزایش سرعت ۱۵.۲۲…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا یادگیری آماری برای درک شهودی موسیقی جاز کافی نیست؟

یک مدل محاسباتی جدید با ترکیب یادگیری کتابخانه‌ای و گراف‌های ای، در تلاش است تا منطق درونی و شهود موسیقی جاز را رمزگشایی کند. این سیستم به جای پیش‌بینی ساده‌ی نت‌ها، به دنبال…

۲ دقیقه خواندن