موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۳ مقاله منتشر شده

معماری «چشم-مغز-دهان»؛ نقطه عطف در واقع‌گرایی عامل‌های چندوجهی

پژوهشگران با معرفی چارچوب EBM-RL، فرآیند ادراک، استدلال و بیان را از هم تفکیک کردند تا نقش‌آفرینی در ویدئو را متحول کنند. این مدل با استفاده از چهار پاداش مجزا، هماهنگی میان…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از تقلب مدل‌های AI در بنچمارک‌های تعمیر کد

پژوهشگران با معرفی AuditRepairBench، راهکاری برای توقف تقلب عامل‌های AI در ارزیابی‌های کدنویسی ارائه کردند. این چارچوب با کاهش ۶۲ درصدی نوسانات رتبه‌بندی، معیارهای عملکردی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان عصر داده‌های برچسب‌دار؛ چگونه SensingAgents ابهام حسگرها را می‌زداید

پژوهشگران با معرفی SensingAgents، چارچوبی عامل‌محور ایجاد کرده‌اند که تشخیص فعالیت‌های انسانی را از طریق شبیه‌سازی بحث‌های استدلالی بهبود می‌بخشد. این سیستم در حالت Zero-shot،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

توهم اخلاق؛ چرا «تفکر» در AI فقط یک فیلتر سازگاری است؟

پژوهشی جدید روی ۵ مدل پیشرو نشان می‌دهد که حالت استدلالی تأثیری در تغییر احکام اخلاقی ندارد، اما تضاد بین مدل‌ها را در سناریوهای پیچیده کاهش می‌دهد. در واقع، «تفکر» بیشتر یک ابزار…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

بودجه AI شما با تخفیف ۷۵ درصدی DeepSeek دگرگون می‌شود

دیپ‌سیک با معرفی مدل‌های V4-Flash و V4-Pro و تخفیف ۷۵ درصدی مدل Pro، جنگ قیمت‌ها در بازار استنتاج را به سطح جدیدی برد. کاهش ۹۰ درصدی هزینه‌های کش ورودی، این پلتفرم را به گزینه‌ای…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چگونه اوبر با مدل‌های استدلالی OpenAI فشار ذهنی رانندگان را گرفت

اوبر با پیاده‌سازی یک معماری عامل‌محور بر پایه OpenAI، منوهای پیچیده اپلیکیشن را با راهنمایی‌های صوتی و استدلالی جایگزین کرده است. این سیستم با هدف بهینه‌سازی درآمد رانندگان و…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

جراحی توهمات؛ استراتژی OpenAI برای تبدیل ChatGPT به یک متخصص مورد اعتماد

شرکت OpenAI مدل GPT-5.5 Instant را به عنوان موتور پیش‌فرض ChatGPT معرفی کرد تا توهمات در حوزه‌های حساس را حذف کند. این به‌روزرسانی با ادغام حافظه عمیق در Gmail و فایل‌ها، دقت…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

راز ۱۰ میلیون توکن؛ وقتی لاگ‌های خام جایگزین آمار می‌شوند

یک اثبات مفهوم جدید نشان می‌دهد که تحلیل ردپاهای خام اجرا، به جای استفاده از آمارهای کلی، می‌تواند بهینه‌سازی عامل‌های هوش مصنوعی را خودکار کند. این سیستم با استفاده از زیرساخت…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

چرا تکامل خودکار هوش مصنوعی، سیستم‌های نظارتی ما را نابود می‌کند؟

جک کلارک، از بنیان‌گذاران Anthropic، هشدار می‌دهد که احتمال ۶۰ درصدی وجود دارد که هوش مصنوعی تا سال ۲۰۲۸ قادر به آموزش نسخه‌های بعدی خود باشد. این چرخه بازگشتی می‌تواند منجر به…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

رمزگشایی از متدولوژی گوگل برای تربیت عامل‌های هوش مصنوعی

ادی اسمانی با معرفی Agent Skills، چارچوبی را ارائه داده که عامل‌های کدنویس را از «اجراکننده‌های جونیور» به «مهندسان ارشد» تبدیل می‌کند. این سیستم با جایگزینی دستورات متنی با…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چرا هوش مصنوعی دیگر منتظر دستور شما نمی‌ماند؟

اوپن‌ای‌آی با معرفی Symphony، عصر جدیدی از اتوماسیون را آغاز کرد که در آن عامل‌های هوشمند مستقیماً تسک‌ها را از تخته‌های مدیریتی برمی‌دارند و اجرا می‌کنند. این سیستم باعث شد سرعت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

۱۸۱ اکسپلویت در برابر ۲ مورد؛ جهش تکان‌دهنده Claude Mythos در شکار باگ

مدل جدید Anthropic با شناسایی حفره‌های امنیتی چنددهه-ساله در سخت‌گیرانه‌ترین سیستم‌ها، مفهوم امنیت را تغییر داد. اکنون رقابت از «یافتن باگ» به «سرعت در وصله کردن» تبدیل شده است.

۳ دقیقه خواندن