
چرا برای بازیابی خطوط تولید دیگر نیازی به بازآموزی مدلهای RL نیست؟
یک چارچوب جدید به سیاستهای RMAPPO اجازه میدهد در لحظهی اجرا از قوانین خارجی یا راهنماییهای مدلهای زبانی استفاده کنند تا سرعت بازیابی خطوط تولید پس از نقص فنی افزایش یابد. این…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۷ مقاله منتشر شده

یک چارچوب جدید به سیاستهای RMAPPO اجازه میدهد در لحظهی اجرا از قوانین خارجی یا راهنماییهای مدلهای زبانی استفاده کنند تا سرعت بازیابی خطوط تولید پس از نقص فنی افزایش یابد. این…

یک ممیزی روی ۱۲ مدل هوش مصنوعی نشان میدهد که جایگاه یک هتل در لیست دادهها، بهطور مستقل بر توصیهی مدل اثر میگذارد. این سوگیری ساختاری باعث میشود ارزش ادراکی هر اتاق شبانه…

متد MHL وزنهای مبهم شبکههای عصبی را با قوانین قطعی پایتونی جایگزین میکند. این چارچوب دقت بالای استانداردهای فعلی را در دادههای پزشکی حفظ کرده و در عین حال قابلیت بازبینی کامل…

چارچوب AdaSTORM با استفاده از تقسیمبندی تطبیقی و معماری چند-عاملی، محدودیت مقیاسپذیری در استدلال گرافهای پویا را شکست. این سیستم بدون نیاز به ابزارهای خارجی، به دقت بیش از ۹۰…

یک چارچوب معماری جدید پیشنهاد میدهد که «خرد» را از «هوش» جدا کند تا از بهینهسازی کورکورانه اهداف مضر جلوگیری شود. این سیستم از طریق یک لایه حاکمیتی و یک توپل ششمؤلفهای، پیش از…

پلتفرم StateGen با معرفی یک مدیریت وضعیت متمرکز و ساختار چهار-نقش، توهمات مربوط به نتایج ابزارها در عاملهای هوش مصنوعی را حذف کرده است. این معماری با تولید دادههای مصنوعی دقیق،…

رویکرد Latent Thought Flow با جایگزینی توکنهای متنی در زنجیره تفکر با مسیرهای پیوسته در فضای پنهان، دقت پاسخدهی را ۹.۵٪ افزایش داده است. این متدولوژی هزینه محاسباتی استنتاج را…

پژوهشگران با معرفی PAL-Bench نشان دادند که مدلهای هوش مصنوعی علیرغم توانایی در خلاصهسازی، در پیوند دادن هویتهای تکرارشونده در دادههای بلندمدت ناتواناند. این شکاف، تفاوت…

یک تحلیل تشخیصی جدید نشان میدهد توانایی یک مدل زبانی در حل مسائل پیچیده، تضمینکننده اثرگذاری آن در تدریس نیست. محققان با استفاده از MathTutorBench دریافتند که معیارهای «حل…

پژوهشگران چارچوب TimeVista را معرفی کردهاند که با بهرهگیری از مدلهای بینایی-زبانی (VLMs)، پیشبینیهای سریهای زمانی را از طریق تحلیل نمودارها ارزیابی میکند. این رویکرد در…

چارچوب استدلالی سبکوزن LiteOdyssey با تکیه بر سیاستهای همکاری انسان-ماشین، در تشخیص بیماریهای بسیار نادر از GPT-5.4 پیشی گرفت. این دستاورد نشان میدهد که ساختار استدلالی دقیق…

VibeThinker-3B مدلی با ۳ میلیارد پارامتر است که در تسکهای استدلالی قابلراستیآزمایی، عملکردی برابر با مدلهای بسیار بزرگتر مانند Gemini 3 Pro دارد. این مدل از یک خط لوله…