
جعل زنجیرههای تفکر، نرخ موفقیت جیلبریک را به ۶۰٪ رساند
پژوهشگران دریافتند که تقلید از سبک تفکر داخلی مدلها، مؤثرترین راه برای دور زدن حفاظهای امنیتی است. این آسیبپذیری بهویژه در درگاههای MCP که محتوای پاسخ ابزارها را بررسی…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۰ مقاله منتشر شده

پژوهشگران دریافتند که تقلید از سبک تفکر داخلی مدلها، مؤثرترین راه برای دور زدن حفاظهای امنیتی است. این آسیبپذیری بهویژه در درگاههای MCP که محتوای پاسخ ابزارها را بررسی…

پژوهشگران دریافتند که معماریهای ترکیبی (Hybrid) در درک کلمات محتوایی و ردیابی وضعیتهای پیچیده موفقتر هستند. با این حال، این مدلها در کپیبرداری دقیق و تطبیق ساختاری، همچنان…

استارتاپ General Intuition برای آموزش استدلال فضایی رباتها از میلیونها ساعت دادههای بازیهای ویدئویی استفاده میکند. این شرکت با جذب ۳۲۰ میلیون دلار سرمایه، قصد دارد شکاف بین…

خوشهای از مقالات پربازدید در Hugging Face نشاندهنده گذاری استراتژیک از مدلهای پاسخدهنده به عاملهایی است که قادر به مدلسازی جهان و اجرای عملیات در زمان واقعی هستند. این تحول…

شرکت OpenAI مدل GPT-5.5 Instant را بهروزرسانی کرد تا بهجای تکرار پاسخهای کلی، هدف واقعی کاربر را درک کند. این تغییر باعث بهبود حفظ بستر گفتگو در چتهای پیچیده و فعالسازی…

شرکت PostHog تجزیهکننده SQL خود را که پیشتر بر پایه C++ بود با نسخهای به زبان Rust جایگزین کرد که توسط هوش مصنوعی نوشته شده است. این تغییر معماری با استفاده از تستهای مبتنی بر…

چارچوب OpenHarness با تفکیک لایهی استدلال مدل از محیط اجرای ابزارها، استقرارهای تجاری عاملهای هوش مصنوعی را ایمنتر میکند. این سیستم از طریق مجوزهای لایهبندی شده و مدیریت پویا…

هوش مصنوعی عاملمحور از مدلهای واکنشی که فقط به پرامپت پاسخ میدهند، فراتر رفته و به سامانههایی تبدیل شده که میتوانند برنامهریزی کنند و ابزارهای خارجی را به کار بگیرند. این…

آمازون با معرفی Strands Labs، امکان کنترل سختافزارهای رباتیک را از طریق دستورات سادهی متنی بهجای توابع ریاضی پیچیده فراهم کرد. این چارچوب ترکیبی از مدلهای VLA در لبه برای…

سامانه LEVI با اتوماسیون کشف الگوریتمهای سیستمی، هزینههای عملیاتی را ۳ تا ۷ برابر کاهش داده و در عین حال به نتایج پیشرو (SOTA) رسیده است. این مدل با تفکیک وظایف بین مدلهای کوچک…

دولت ایالات متحده از شرکت متا میخواهد مدلهای خود را برای شناسایی نقاط ضعف امنیتی تحویل دهد. متا تنها شرکت بزرگ توسعهدهنده است که هنوز با این درخواستهای داوطلبانه همکاری نکرده…

مدیرعامل شرکت Pangram معتقد است مدلهای زبانی با وجود تسلط بر دستور زبان، فاقد تنوع استدلالی انسانها هستند. این ابزار تشخیص AI از طریق شناسایی الگوهای ساختاری و محدود بودن طیف…