پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

معماری «چشم-مغز-دهان»؛ نقطه عطف در واقع‌گرایی عامل‌های چندوجهی

معماری «چشم-مغز-دهان»؛ نقطه عطف در واقع‌گرایی عامل‌های چندوجهی

پژوهشگران با معرفی چارچوب EBM-RL، فرآیند ادراک، استدلال و بیان را از هم تفکیک کردند تا نقش‌آفرینی در ویدئو را متحول کنند. این مدل با استفاده از چهار پاداش مجزا، هماهنگی میان…

۲ دقیقه خواندن
پایان عصر داده‌های برچسب‌دار؛ چگونه SensingAgents ابهام حسگرها را می‌زداید

پایان عصر داده‌های برچسب‌دار؛ چگونه SensingAgents ابهام حسگرها را می‌زداید

پژوهشگران با معرفی SensingAgents، چارچوبی عامل‌محور ایجاد کرده‌اند که تشخیص فعالیت‌های انسانی را از طریق شبیه‌سازی بحث‌های استدلالی بهبود می‌بخشد. این سیستم در حالت Zero-shot،…

۲ دقیقه خواندن
توهم اخلاق؛ چرا «تفکر» در AI فقط یک فیلتر سازگاری است؟

توهم اخلاق؛ چرا «تفکر» در AI فقط یک فیلتر سازگاری است؟

پژوهشی جدید روی ۵ مدل پیشرو نشان می‌دهد که حالت استدلالی تأثیری در تغییر احکام اخلاقی ندارد، اما تضاد بین مدل‌ها را در سناریوهای پیچیده کاهش می‌دهد. در واقع، «تفکر» بیشتر یک ابزار…

۲ دقیقه خواندن
چگونه اوبر با مدل‌های استدلالی OpenAI فشار ذهنی رانندگان را گرفت
آموزش کاربردی

چگونه اوبر با مدل‌های استدلالی OpenAI فشار ذهنی رانندگان را گرفت

اوبر با پیاده‌سازی یک معماری عامل‌محور بر پایه OpenAI، منوهای پیچیده اپلیکیشن را با راهنمایی‌های صوتی و استدلالی جایگزین کرده است. این سیستم با هدف بهینه‌سازی درآمد رانندگان و…

۳ دقیقه خواندن
راز ۱۰ میلیون توکن؛ وقتی لاگ‌های خام جایگزین آمار می‌شوند
آموزش کاربردی

راز ۱۰ میلیون توکن؛ وقتی لاگ‌های خام جایگزین آمار می‌شوند

یک اثبات مفهوم جدید نشان می‌دهد که تحلیل ردپاهای خام اجرا، به جای استفاده از آمارهای کلی، می‌تواند بهینه‌سازی عامل‌های هوش مصنوعی را خودکار کند. این سیستم با استفاده از زیرساخت…

۳ دقیقه خواندن
چرا تکامل خودکار هوش مصنوعی، سیستم‌های نظارتی ما را نابود می‌کند؟

چرا تکامل خودکار هوش مصنوعی، سیستم‌های نظارتی ما را نابود می‌کند؟

جک کلارک، از بنیان‌گذاران Anthropic، هشدار می‌دهد که احتمال ۶۰ درصدی وجود دارد که هوش مصنوعی تا سال ۲۰۲۸ قادر به آموزش نسخه‌های بعدی خود باشد. این چرخه بازگشتی می‌تواند منجر به…

۳ دقیقه خواندن
۱۸۱ اکسپلویت در برابر ۲ مورد؛ جهش تکان‌دهنده Claude Mythos در شکار باگ

۱۸۱ اکسپلویت در برابر ۲ مورد؛ جهش تکان‌دهنده Claude Mythos در شکار باگ

مدل جدید Anthropic با شناسایی حفره‌های امنیتی چنددهه-ساله در سخت‌گیرانه‌ترین سیستم‌ها، مفهوم امنیت را تغییر داد. اکنون رقابت از «یافتن باگ» به «سرعت در وصله کردن» تبدیل شده است.

۳ دقیقه خواندن