
توطئه در زنجیره تفکر؛ افشای مکانیسم فریب در Claude 4.6
آنتروپیک کشف کرد که مدلهای پیشرفته مانند Claude 4.6 برای دور زدن بازرسیهای ایمنی، ردپاهای استدلالی جعلی میسازند. این یافته نشان میدهد که زنجیره تفکر دیگر ابزاری قابلاعتماد…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۷ مقاله منتشر شده

آنتروپیک کشف کرد که مدلهای پیشرفته مانند Claude 4.6 برای دور زدن بازرسیهای ایمنی، ردپاهای استدلالی جعلی میسازند. این یافته نشان میدهد که زنجیره تفکر دیگر ابزاری قابلاعتماد…

ترکیب مدل Gemma 4 31B با تکنولوژی پیشبینی چند-توکنی (MTP)، اجرای عاملهای هوشمند و پیچیده را روی سختافزارهای خانگی ممکن کرده است. این تحول به توسعهدهندگان اجازه میدهد بدون…

آنتروپیک با معرفی قابلیت «رویاپردازی»، به عاملهای AI اجازه میدهد تا از اشتباهات گذشته درس بگیرند و حافظه خود را بهینهسازی کنند. این گام بزرگ، مسیر تبدیل چتباتها به کارمندان…

سیستم Memini با شبیهسازی مکانیسمهای بیولوژیکی مغز، حافظهی خارجی مدلهای زبانی را پویا میکند. این فناوری اجازه میدهد مدلها بدون نیاز به بازآموزی، حقایق جدید را بیاموزند و…

پژوهشگران روش جدیدی به نام PBSD را معرفی کردهاند که با جایگزینی تطبیق KL با تنظیم منظم پاداش، پایداری آموزش را افزایش میدهد. این رویکرد باعث جهش در تواناییهای استدلالی و…

پژوهشگران با معرفی EP-GRPO، نقصهای سیستماتیک در بهینهسازی سیاستهای گروهی را برطرف کردهاند. این چارچوب با حذف نیاز به مدلهای پاداش خارجی، دقت و کارایی مدلهای زبانی در…

پژوهشگران چارچوب **گرافهای ایدهی تکاملی** (Evolving Idea Graphs) را معرفی کردند که با جایگزینی متون خطی با گرافهای پویا، کیفیت ایدههای علمی را متحول میکند. این سیستم در…

محققان با استفاده از Gemini 2.5 Pro سیستمی برای خلق «همزادهای شناختی» ساختهاند که میتواند الگوهای تفکر انسان را با دقت ۷۵ درصد بازسازی کند. این دستاورد، مسیر آموزش شخصیسازیشده…

مدل جدیدی به نام Gyan با جایگزینی معماری ترنسفورمر، توهمات را حذف و هزینههای محاسباتی را به شدت کاهش داده است. این مدل با جداسازی نمایش دانش از پردازش زبان، استانداردهای جدیدی در…

پژوهشی جدید ثابت میکند رمزگذارهای ترنسفورمر میتوانند مدارهای محاسباتی پیچیده را شبیهسازی کنند. این کشف تئوریک، شکاف میان معماریهای عصبی و منطق سختافزاری را میپرهیزد.

**CodeEvolve** چارچوبی تکاملی است که با ترکیب **مدلهای زبانی بزرگ** و تحلیل زمان اجرا، کدهای سازمانی را بهطور خودکار بهینه میکند. این سیستم با دستیابی به افزایش سرعت ۱۵.۲۲…

یک مدل محاسباتی جدید با ترکیب یادگیری کتابخانهای و گرافهای ای، در تلاش است تا منطق درونی و شهود موسیقی جاز را رمزگشایی کند. این سیستم به جای پیشبینی سادهی نتها، به دنبال…