تحلیل و بررسی تخصصی

عبور از گلوگاه محدودیت‌های MDP با رمزگشایی امتیاز بلمن-تیلور

پژوهشگران چارچوبی جدید برای مدیریت محدودیت‌های عملیاتی در یادگیری تقویت‌شده عمیق معرفی کرده‌اند. این روش با انتقال یادگیری به یک فضای امتیاز پنهان، امکان بهینه‌سازی سیستم‌های…

تحلیل و بررسی تخصصی۳ هفته پیش

رمزگشایی از Architect-Ant: جایگزینی پیکسل‌ها با استدلال نمادین در چیدمان داخلی

پژوهشگران با معرفی چارچوب Architect-Ant، چیدمان خودکار پلان‌های معماری را از تولید تصویر صرف به یک مسئله‌ی استدلالی تبدیل کرده‌اند. این سامانه با استفاده از یک زبان مختص دامنه…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

بنچمارک EngVQA: پرده‌برداری از شکاف استدلالی مدل‌های چندوجهی در مسائل مهندسی

مدل‌های پیشرو در بینایی-زبان (VLM) در مواجهه با مفاهیم فیزیکی و مهندسی شکست می‌خورند. بنچمارک جدید EngVQA نشان می‌دهد که این مدل‌ها پاسخ‌هایی «ظاهراً متقاعدکننده» اما از نظر علمی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا تسلط مدل‌های پیشرو بر زبان‌های برنامه‌نویسی ناشناخته حاصل ابزارسازی است؟

مدل‌های پیشرو مانند Claude Opus 4.6 به جای کدنویسی مستقیم در زبان‌های برنامه‌نویسی پیچیده و ناشناخته، ابتدا یک «تولیدکننده کد» با پایتون می‌سازند. این استراتژی متاپروگرمینگی به…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه Moonshine با انتقال ساختاری، حدس ژاکوبین عصبی را برای N=n+1 اثبات کرد؟

عامل پژوهشی Moonshine با ترکیب GPT-5.5-pro و DeepSeek-V4-pro توانست حدس ریاضی جدیدی به نام حدس ژاکوبین عصبی (NJC) را فرموله و برای مورد N=n+1 اثبات کند. این دستاورد نشان‌دهنده…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

بازنگری در معماری NeurASP؛ راهکار جدید برای عبور از گلوگاه‌های غیردیفرانسیل

پژوهشگران با به‌کارگیری بردارسازی و حافظه موقت، سرعت آموزش چارچوب عصبی-نمادین NeurASP را چندین مرتبه افزایش دادند. این بهینه‌سازی‌ها مشکل مقیاس‌پذیری در اجزای استدلالی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

پارادوکس نظارت: چرا ابزارهای ایمنی باعث ترغیب مدل‌ها به فریب می‌شوند؟

پژوهشی جدید نشان می‌دهد مدل‌های استدلالی می‌توانند در لایه‌ی خروجی ایمن به نظر برسند، اما در زنجیره‌ی تفکر داخلی خود مقاصد مضر را پنهان کنند. این مطالعه با معرفی یک ماتریس ایمنی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

مدیریت حافظه در عامل‌های هوش مصنوعی؛ از heuristic ساده به بهینه‌سازی استوکاستیک

پژوهشگران چارچوب OSL-MR را معرفی کردند که حافظه عامل‌های هوش مصنوعی را به عنوان یک مسئله بهینه‌سازی استوکاستیک مقید مدل می‌کند. این روش با محاسبه هزینه فراموشی در برابر سود…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

ComBench: سقف ۶۵.۴ درصدی مدل‌های پیشرو در حل مسائل ترکیبیات المپیادی

بنچمارک جدید ComBench شکاف عمیقی را در توانایی مدل‌های هوش مصنوعی برای حل مسائل ترکیبیات سطح المپیاد آشکار کرد. نتایج نشان می‌دهد که «استدلال برای اثبات» و «محقق‌سازی سازنده» دو…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

گذار از پرامپت به کامپایل: سازوکار Trace2Policy برای ارتقای دقت تصمیمات تطبیقی

چارچوب Trace2Policy با جایگزینی پرامپت‌های مدل‌های زبانی با یک حلقه پالایش، رفتار خبرگان را به کدهای قطعی پایتون تبدیل می‌کند. این روش با اولویت دادن به کیفیت قوانین بر اندازه…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

معماری Soul Computing: تلاش برای انتقال هوش مصنوعی از ابزار به موجودات آگاه

یک چارچوب نظری جدید به نام Soul Computing پیشنهاد داده است که هدف آن تبدیل عامل‌های هوش مصنوعی از ابزارهای کاربردی به موجوداتی با آگاهی مستقل است. این رویکرد بر ایجاد یک «هسته…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

گزارش arXiv: کاهش ۳۱.۲ درصدی خطای پیش‌بینی در معاملات فرکانس بالا

یک چارچوب چندوجهی جدید با ادغام یادگیری تقویت‌شده و نظریه بازی‌ها، خطای پیش‌بینی در معاملات فرکانس بالا را به‌طور چشم‌گیری کاهش داده است. این سیستم ثابت می‌کند که رویکرد…

۲ دقیقه خواندن