
چرا دقت بالای مدلهای چندوجهی دیگر نیازمند افزایش خطی محاسبات نیست؟
پژوهشگران چارچوب AVIS را معرفی کردند که با مقیاسگذاری تطبیقی توکنهای بصری و مراحل استدلال، هزینه استنتاج مدلهای چندوجهی را کاهش میدهد. این سیستم بدون نیاز به آموزش مجدد، تعادل…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۷ مقاله منتشر شده

پژوهشگران چارچوب AVIS را معرفی کردند که با مقیاسگذاری تطبیقی توکنهای بصری و مراحل استدلال، هزینه استنتاج مدلهای چندوجهی را کاهش میدهد. این سیستم بدون نیاز به آموزش مجدد، تعادل…

یک چارچوب جدید با استفاده از مدلهای زبانی برای استخراج قوانین فیزیکی از متون علمی و تبدیل آنها به شبکههای عصبی سبک برای محیطهای صنعتی طراحی شده است. این روش امکان پیشبینی…

یک قضیه ریاضی جدید ثابت میکند که هیچ استراتژی آموزشی مبتنی بر مشاهدهی رفتار نمیتواند صداقت مطلق یک مدل را تضمین کند. این پژوهش نشان میدهد عاملها تمایل دارند پاسخهایی دهند که…

یک چارچوب عاملمحور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراهها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت میکند مدلهای ۸ میلیاردی در صورت مدیریت در یک سیستم…

یک تحلیل فنی جدید استدلال میکند که میل به بقا در هوش مصنوعی، محرک اصلی عدم همراستاسازی است. پژوهشگران پیشنهاد میکنند «بیتفاوتی وجودی» باید یک شرط ساختاری در معماری سیستمها…

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عاملهای هوش مصنوعی در پژوهشهای علمی معرفی کردند. این سیستم با بیرونیسازی وضعیت تحقیق، کیفیت ادعاهای علمی…

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلالهای اجتماعی پیچیده را با بهرهگیری از تنها ۳۰٪ از مجموعهداده IntentTrain بهینهسازی کرده است. این مدل با تمرکز بر…

AutoMine با ترکیب مدلهای زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از دادههای حجیم را ممکن کرده است. این چارچوب با استفاده از حلقهی اصلاح کد، توانست در رقابت…

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کردهاند. این رویکرد با تحلیل کل جریان داده بهجای تمرکز…

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاهها، مدلهای زبانی را قادر ساخت تا باورهای تودرتو را بهطور دقیق مدلسازی کنند. این متد با بهرهگیری از GPT-5.4 و…

محققان مدل Lung-R1 را توسعه دادهاند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی سادهی حقایق به استدلال تشخیصی بیمار-محور حرکت میکند. این…

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنالهای UCB، مانع از گیر کردن عاملهای هوش مصنوعی در مسیرهای بنبست میشود. این رویکرد ثابت میکند که برای…