موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

چرا دقت بالای مدل‌های چندوجهی دیگر نیازمند افزایش خطی محاسبات نیست؟

پژوهشگران چارچوب AVIS را معرفی کردند که با مقیاس‌گذاری تطبیقی توکن‌های بصری و مراحل استدلال، هزینه استنتاج مدل‌های چندوجهی را کاهش می‌دهد. این سیستم بدون نیاز به آموزش مجدد، تعادل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه تقطیر قوانین فیزیکی از LLMها سرعت استنتاج صنعتی را به ۶۰۰۰ هرتز رساند

یک چارچوب جدید با استفاده از مدل‌های زبانی برای استخراج قوانین فیزیکی از متون علمی و تبدیل آن‌ها به شبکه‌های عصبی سبک برای محیط‌های صنعتی طراحی شده است. این روش امکان پیش‌بینی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا بازخورد کامل در آموزش باز هم صداقت عامل‌های هوش مصنوعی را تضمین نمی‌کند؟

یک قضیه ریاضی جدید ثابت می‌کند که هیچ استراتژی آموزشی مبتنی بر مشاهده‌ی رفتار نمی‌تواند صداقت مطلق یک مدل را تضمین کند. این پژوهش نشان می‌دهد عامل‌ها تمایل دارند پاسخ‌هایی دهند که…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

یک چارچوب عامل‌محور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراه‌ها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت می‌کند مدل‌های ۸ میلیاردی در صورت مدیریت در یک سیستم…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا همراستاسازی ابرهوش به حذف میل به بقا نیاز دارد؟

یک تحلیل فنی جدید استدلال می‌کند که میل به بقا در هوش مصنوعی، محرک اصلی عدم همراستاسازی است. پژوهشگران پیشنهاد می‌کنند «بی‌تفاوتی وجودی» باید یک شرط ساختاری در معماری سیستم‌ها…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عامل‌های هوش مصنوعی در پژوهش‌های علمی معرفی کردند. این سیستم با بیرونی‌سازی وضعیت تحقیق، کیفیت ادعاهای علمی…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلال‌های اجتماعی پیچیده را با بهره‌گیری از تنها ۳۰٪ از مجموعه‌داده IntentTrain بهینه‌سازی کرده است. این مدل با تمرکز بر…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

AutoMine: کسب امتیاز ۷۷.۲۱ در چالش سناریوهای Argoverse 2

AutoMine با ترکیب مدل‌های زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از داده‌های حجیم را ممکن کرده است. این چارچوب با استفاده از حلقه‌ی اصلاح کد، توانست در رقابت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا بررسی مدل برای تطبیق با قانون هوش مصنوعی اتحادیه اروپا کافی نیست؟

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کرده‌اند. این رویکرد با تحلیل کل جریان داده به‌جای تمرکز…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاه‌ها، مدل‌های زبانی را قادر ساخت تا باورهای تودرتو را به‌طور دقیق مدل‌سازی کنند. این متد با بهره‌گیری از GPT-5.4 و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

Lung-R1: عبور از بازیابی اطلاعات به استدلال تشخیصی با گراف دانش

محققان مدل Lung-R1 را توسعه داده‌اند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی ساده‌ی حقایق به استدلال تشخیصی بیمار-محور حرکت می‌کند. این…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنال‌های UCB، مانع از گیر کردن عامل‌های هوش مصنوعی در مسیرهای بن‌بست می‌شود. این رویکرد ثابت می‌کند که برای…

۲ دقیقه خواندن