
معماری «چشم-مغز-دهان»؛ نقطه عطف در واقعگرایی عاملهای چندوجهی
پژوهشگران با معرفی چارچوب EBM-RL، فرآیند ادراک، استدلال و بیان را از هم تفکیک کردند تا نقشآفرینی در ویدئو را متحول کنند. این مدل با استفاده از چهار پاداش مجزا، هماهنگی میان…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۳ مقاله منتشر شده

پژوهشگران با معرفی چارچوب EBM-RL، فرآیند ادراک، استدلال و بیان را از هم تفکیک کردند تا نقشآفرینی در ویدئو را متحول کنند. این مدل با استفاده از چهار پاداش مجزا، هماهنگی میان…

پژوهشگران با معرفی AuditRepairBench، راهکاری برای توقف تقلب عاملهای AI در ارزیابیهای کدنویسی ارائه کردند. این چارچوب با کاهش ۶۲ درصدی نوسانات رتبهبندی، معیارهای عملکردی…

پژوهشگران با معرفی SensingAgents، چارچوبی عاملمحور ایجاد کردهاند که تشخیص فعالیتهای انسانی را از طریق شبیهسازی بحثهای استدلالی بهبود میبخشد. این سیستم در حالت Zero-shot،…

پژوهشی جدید روی ۵ مدل پیشرو نشان میدهد که حالت استدلالی تأثیری در تغییر احکام اخلاقی ندارد، اما تضاد بین مدلها را در سناریوهای پیچیده کاهش میدهد. در واقع، «تفکر» بیشتر یک ابزار…

دیپسیک با معرفی مدلهای V4-Flash و V4-Pro و تخفیف ۷۵ درصدی مدل Pro، جنگ قیمتها در بازار استنتاج را به سطح جدیدی برد. کاهش ۹۰ درصدی هزینههای کش ورودی، این پلتفرم را به گزینهای…

اوبر با پیادهسازی یک معماری عاملمحور بر پایه OpenAI، منوهای پیچیده اپلیکیشن را با راهنماییهای صوتی و استدلالی جایگزین کرده است. این سیستم با هدف بهینهسازی درآمد رانندگان و…

شرکت OpenAI مدل GPT-5.5 Instant را به عنوان موتور پیشفرض ChatGPT معرفی کرد تا توهمات در حوزههای حساس را حذف کند. این بهروزرسانی با ادغام حافظه عمیق در Gmail و فایلها، دقت…

یک اثبات مفهوم جدید نشان میدهد که تحلیل ردپاهای خام اجرا، به جای استفاده از آمارهای کلی، میتواند بهینهسازی عاملهای هوش مصنوعی را خودکار کند. این سیستم با استفاده از زیرساخت…

جک کلارک، از بنیانگذاران Anthropic، هشدار میدهد که احتمال ۶۰ درصدی وجود دارد که هوش مصنوعی تا سال ۲۰۲۸ قادر به آموزش نسخههای بعدی خود باشد. این چرخه بازگشتی میتواند منجر به…

ادی اسمانی با معرفی Agent Skills، چارچوبی را ارائه داده که عاملهای کدنویس را از «اجراکنندههای جونیور» به «مهندسان ارشد» تبدیل میکند. این سیستم با جایگزینی دستورات متنی با…

اوپنایآی با معرفی Symphony، عصر جدیدی از اتوماسیون را آغاز کرد که در آن عاملهای هوشمند مستقیماً تسکها را از تختههای مدیریتی برمیدارند و اجرا میکنند. این سیستم باعث شد سرعت…

مدل جدید Anthropic با شناسایی حفرههای امنیتی چنددهه-ساله در سختگیرانهترین سیستمها، مفهوم امنیت را تغییر داد. اکنون رقابت از «یافتن باگ» به «سرعت در وصله کردن» تبدیل شده است.