پرش به محتوای اصلی

موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟
آموزش کاربردی

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

پلتفرم Statewright با معرفی «گاردریل‌های ماشین وضعیت»، دسترسی عامل‌های هوش مصنوعی به ابزارها را بر اساس مرحله‌ی جاریِ گردش کار محدود می‌کند. این رویکرد قطعی باعث شد مدل‌های محلی…

۲ دقیقه خواندن
برد انسانی در برابر XBOW: چرا «مایل آخر» نفوذ هنوز خارج از دسترس هوش مصنوعی است؟

برد انسانی در برابر XBOW: چرا «مایل آخر» نفوذ هنوز خارج از دسترس هوش مصنوعی است؟

یک آزمایش امنیتی، متخصص ۲۰ ساله را در برابر یک عامل هوش مصنوعی قرار داد تا یک باگ بحرانی در Exim را استخراج کنند. هوش مصنوعی در محیط‌های ساده پیروز شد، اما در نسخه واقعی، تنها…

۲ دقیقه خواندن
LegalCiteBench: نرخ خطای ۹۴ درصدی مدل‌های زبانی در بازیابی استنادات حقوقی

LegalCiteBench: نرخ خطای ۹۴ درصدی مدل‌های زبانی در بازیابی استنادات حقوقی

یک بنچمارک جدید نشان می‌دهد که پیشرفته‌ترین مدل‌های زبانی در بازیابی دقیق استنادات حقوقی بدون دسترسی به منابع خارجی شکست می‌خورند. این مطالعه ثابت می‌کند که مقیاس مدل و پیش‌آموزش…

۲ دقیقه خواندن
از تشخیص باینری تا تحلیل شدت: سازوکار IMPACT در مدیریت تضادهای داوری علمی

از تشخیص باینری تا تحلیل شدت: سازوکار IMPACT در مدیریت تضادهای داوری علمی

پژوهشگران چارچوب چندعاملی IMPACT را برای شناسایی و درجه‌بندی شدت تضادها در داوری‌های علمی توسعه داده‌اند. این سیستم با استفاده از بنچمارک RevCI و مدل زبانی کوچک TIDE، دقت تحلیل…

۲ دقیقه خواندن
چرا تزریق دانش گراف‌محور در میکروسکوپی از تنظیم دقیق مدل‌های زبانی کارآمدتر است؟

چرا تزریق دانش گراف‌محور در میکروسکوپی از تنظیم دقیق مدل‌های زبانی کارآمدتر است؟

چارچوب MicroWorld با استفاده از گراف‌های ویژگی چندوجهی، دقت مدل Qwen3-VL را در استدلال‌های میکروسکوپی ۱۳٪ بیشتر از GPT-5 کرد. این دستاورد ثابت می‌کند بازیابی دانش ساختاریافته…

۲ دقیقه خواندن
ViSRA: افزایش ۲۸.۹ درصدی دقت استدلال فضایی در مدل‌های زبانی بدون آموزش مجدد

ViSRA: افزایش ۲۸.۹ درصدی دقت استدلال فضایی در مدل‌های زبانی بدون آموزش مجدد

چارچوب ViSRA با حذف نیاز به آموزش‌های هزینه‌بر، استدلال فضایی سه‌بعدی را در مدل‌های چندوجهی ارتقا می‌دهد. این سیستم با تکیه بر مدل‌های خبره، در وظایف پیش‌بینی‌نشده تا ۲۸.۹٪ بهتر…

۲ دقیقه خواندن
تکه‌بندی تطبیقی اقدامات: راهکاری برای حذف محدودیت طول توالی در یادگیری تقویت‌شده

تکه‌بندی تطبیقی اقدامات: راهکاری برای حذف محدودیت طول توالی در یادگیری تقویت‌شده

الگوریتم جدید ACH با جایگزینی توالی‌های ثابت با مکانیزم‌های پویا، اجازه می‌دهد عامل‌های RL طول توالی اقدامات را بر اساس وضعیت محیط تغییر دهند. این رویکرد در ۳۴ تکلیف پیچیده،…

۲ دقیقه خواندن
سازوکار حافظه یکپارچه: حذف گلوگاه‌های معنایی برای استدلال عامل‌محور در 6G

سازوکار حافظه یکپارچه: حذف گلوگاه‌های معنایی برای استدلال عامل‌محور در 6G

یک معماری پیشنهادی برای شبکه‌های 6G، رابط‌های سنتی پیام‌رسانی را با پارادایم حافظه‌محور جایگزین می‌کند. این تغییر به عامل‌های هوش مصنوعی اجازه می‌دهد بدون اتلاف داده‌های ناشی از…

۲ دقیقه خواندن
تزریق پارالینگویستیک: ارتقای دقت تشخیص بحران‌های روانی در LLMها به ۸۰.۵٪

تزریق پارالینگویستیک: ارتقای دقت تشخیص بحران‌های روانی در LLMها به ۸۰.۵٪

پژوهشگران چارچوبی برای مدل‌های زبانی توسعه داده‌اند که با تزریق نشانه‌های احساسی غیرکلامی به متن گفتگو، سطح بحران‌های روانی را شناسایی می‌کند. این سیستم با ترکیب تحلیل‌های صوتی و…

۲ دقیقه خواندن
سازوکار Move Prover: ترکیب تحلیل WP و عامل‌های هوش مصنوعی برای حذف Boilerplate

سازوکار Move Prover: ترکیب تحلیل WP و عامل‌های هوش مصنوعی برای حذف Boilerplate

یک ابزار جدید برای استنتاج مشخصات در Move Prover، تحلیل مکانیکی WP را با عامل‌های هوش مصنوعی از طریق پروتکل MCP ترکیب کرده است. این سیستم ترکیبی، تولید پیش‌شرط‌ها و پس‌شرط‌ها را…

۲ دقیقه خواندن
چرا G-Zero نیاز به مدل‌های داور را در تکامل خودکار هوش مصنوعی حذف می‌کند؟

چرا G-Zero نیاز به مدل‌های داور را در تکامل خودکار هوش مصنوعی حذف می‌کند؟

چارچوب G-Zero با حذف نیاز به مدل‌های داور خارجی، امکان تکامل خودکار مدل‌های زبانی در وظایف باز را فراهم می‌کند. این سیستم از طریق سازوکار Hint-δ، نقاط کور مدل را شناسایی کرده و…

۲ دقیقه خواندن
سازوکار TPAW: حذف وابستگی به داده‌های انسانی در همراستاسازی مدل‌های زبانی

سازوکار TPAW: حذف وابستگی به داده‌های انسانی در همراستاسازی مدل‌های زبانی

الگوریتم TPAW با جایگزینی نظارت انسانی با یک چارچوب رقابتی تیمی میان نسخه‌های مختلف مدل، پایداری همراستاسازی را افزایش می‌دهد. این روش با استفاده از وزن‌دهی تطبیقی، مشکل تقویت…

۲ دقیقه خواندن