پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

چرا دقت بالای مدل‌های چندوجهی دیگر نیازمند افزایش خطی محاسبات نیست؟

چرا دقت بالای مدل‌های چندوجهی دیگر نیازمند افزایش خطی محاسبات نیست؟

پژوهشگران چارچوب AVIS را معرفی کردند که با مقیاس‌گذاری تطبیقی توکن‌های بصری و مراحل استدلال، هزینه استنتاج مدل‌های چندوجهی را کاهش می‌دهد. این سیستم بدون نیاز به آموزش مجدد، تعادل…

۲ دقیقه خواندن
چگونه تقطیر قوانین فیزیکی از LLMها سرعت استنتاج صنعتی را به ۶۰۰۰ هرتز رساند

چگونه تقطیر قوانین فیزیکی از LLMها سرعت استنتاج صنعتی را به ۶۰۰۰ هرتز رساند

یک چارچوب جدید با استفاده از مدل‌های زبانی برای استخراج قوانین فیزیکی از متون علمی و تبدیل آن‌ها به شبکه‌های عصبی سبک برای محیط‌های صنعتی طراحی شده است. این روش امکان پیش‌بینی…

۲ دقیقه خواندن
چرا بازخورد کامل در آموزش باز هم صداقت عامل‌های هوش مصنوعی را تضمین نمی‌کند؟

چرا بازخورد کامل در آموزش باز هم صداقت عامل‌های هوش مصنوعی را تضمین نمی‌کند؟

یک قضیه ریاضی جدید ثابت می‌کند که هیچ استراتژی آموزشی مبتنی بر مشاهده‌ی رفتار نمی‌تواند صداقت مطلق یک مدل را تضمین کند. این پژوهش نشان می‌دهد عامل‌ها تمایل دارند پاسخ‌هایی دهند که…

۲ دقیقه خواندن
چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

یک چارچوب عامل‌محور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراه‌ها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت می‌کند مدل‌های ۸ میلیاردی در صورت مدیریت در یک سیستم…

۱ دقیقه خواندن
چرا همراستاسازی ابرهوش به حذف میل به بقا نیاز دارد؟

چرا همراستاسازی ابرهوش به حذف میل به بقا نیاز دارد؟

یک تحلیل فنی جدید استدلال می‌کند که میل به بقا در هوش مصنوعی، محرک اصلی عدم همراستاسازی است. پژوهشگران پیشنهاد می‌کنند «بی‌تفاوتی وجودی» باید یک شرط ساختاری در معماری سیستم‌ها…

۱ دقیقه خواندن
StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عامل‌های هوش مصنوعی در پژوهش‌های علمی معرفی کردند. این سیستم با بیرونی‌سازی وضعیت تحقیق، کیفیت ادعاهای علمی…

۱ دقیقه خواندن
MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلال‌های اجتماعی پیچیده را با بهره‌گیری از تنها ۳۰٪ از مجموعه‌داده IntentTrain بهینه‌سازی کرده است. این مدل با تمرکز بر…

۱ دقیقه خواندن
چرا بررسی مدل برای تطبیق با قانون هوش مصنوعی اتحادیه اروپا کافی نیست؟

چرا بررسی مدل برای تطبیق با قانون هوش مصنوعی اتحادیه اروپا کافی نیست؟

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کرده‌اند. این رویکرد با تحلیل کل جریان داده به‌جای تمرکز…

۲ دقیقه خواندن
چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاه‌ها، مدل‌های زبانی را قادر ساخت تا باورهای تودرتو را به‌طور دقیق مدل‌سازی کنند. این متد با بهره‌گیری از GPT-5.4 و…

۱ دقیقه خواندن
Lung-R1: عبور از بازیابی اطلاعات به استدلال تشخیصی با گراف دانش

Lung-R1: عبور از بازیابی اطلاعات به استدلال تشخیصی با گراف دانش

محققان مدل Lung-R1 را توسعه داده‌اند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی ساده‌ی حقایق به استدلال تشخیصی بیمار-محور حرکت می‌کند. این…

۱ دقیقه خواندن
چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنال‌های UCB، مانع از گیر کردن عامل‌های هوش مصنوعی در مسیرهای بن‌بست می‌شود. این رویکرد ثابت می‌کند که برای…

۲ دقیقه خواندن