موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

چرا مدل‌های محلی ۱۳ میلیاردی با Statewright در کدنویسی به دقت ۱۰۰ درصدی رسیدند؟

پلتفرم Statewright با معرفی «گاردریل‌های ماشین وضعیت»، دسترسی عامل‌های هوش مصنوعی به ابزارها را بر اساس مرحله‌ی جاریِ گردش کار محدود می‌کند. این رویکرد قطعی باعث شد مدل‌های محلی…

۲ دقیقه خواندن

داستان‌ها و مصاحبه‌ها۲ ماه پیش

برد انسانی در برابر XBOW: چرا «مایل آخر» نفوذ هنوز خارج از دسترس هوش مصنوعی است؟

یک آزمایش امنیتی، متخصص ۲۰ ساله را در برابر یک عامل هوش مصنوعی قرار داد تا یک باگ بحرانی در Exim را استخراج کنند. هوش مصنوعی در محیط‌های ساده پیروز شد، اما در نسخه واقعی، تنها…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

LegalCiteBench: نرخ خطای ۹۴ درصدی مدل‌های زبانی در بازیابی استنادات حقوقی

یک بنچمارک جدید نشان می‌دهد که پیشرفته‌ترین مدل‌های زبانی در بازیابی دقیق استنادات حقوقی بدون دسترسی به منابع خارجی شکست می‌خورند. این مطالعه ثابت می‌کند که مقیاس مدل و پیش‌آموزش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

از تشخیص باینری تا تحلیل شدت: سازوکار IMPACT در مدیریت تضادهای داوری علمی

پژوهشگران چارچوب چندعاملی IMPACT را برای شناسایی و درجه‌بندی شدت تضادها در داوری‌های علمی توسعه داده‌اند. این سیستم با استفاده از بنچمارک RevCI و مدل زبانی کوچک TIDE، دقت تحلیل…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا تزریق دانش گراف‌محور در میکروسکوپی از تنظیم دقیق مدل‌های زبانی کارآمدتر است؟

چارچوب MicroWorld با استفاده از گراف‌های ویژگی چندوجهی، دقت مدل Qwen3-VL را در استدلال‌های میکروسکوپی ۱۳٪ بیشتر از GPT-5 کرد. این دستاورد ثابت می‌کند بازیابی دانش ساختاریافته…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ViSRA: افزایش ۲۸.۹ درصدی دقت استدلال فضایی در مدل‌های زبانی بدون آموزش مجدد

چارچوب ViSRA با حذف نیاز به آموزش‌های هزینه‌بر، استدلال فضایی سه‌بعدی را در مدل‌های چندوجهی ارتقا می‌دهد. این سیستم با تکیه بر مدل‌های خبره، در وظایف پیش‌بینی‌نشده تا ۲۸.۹٪ بهتر…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تکه‌بندی تطبیقی اقدامات: راهکاری برای حذف محدودیت طول توالی در یادگیری تقویت‌شده

الگوریتم جدید ACH با جایگزینی توالی‌های ثابت با مکانیزم‌های پویا، اجازه می‌دهد عامل‌های RL طول توالی اقدامات را بر اساس وضعیت محیط تغییر دهند. این رویکرد در ۳۴ تکلیف پیچیده،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار حافظه یکپارچه: حذف گلوگاه‌های معنایی برای استدلال عامل‌محور در 6G

یک معماری پیشنهادی برای شبکه‌های 6G، رابط‌های سنتی پیام‌رسانی را با پارادایم حافظه‌محور جایگزین می‌کند. این تغییر به عامل‌های هوش مصنوعی اجازه می‌دهد بدون اتلاف داده‌های ناشی از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تزریق پارالینگویستیک: ارتقای دقت تشخیص بحران‌های روانی در LLMها به ۸۰.۵٪

پژوهشگران چارچوبی برای مدل‌های زبانی توسعه داده‌اند که با تزریق نشانه‌های احساسی غیرکلامی به متن گفتگو، سطح بحران‌های روانی را شناسایی می‌کند. این سیستم با ترکیب تحلیل‌های صوتی و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار Move Prover: ترکیب تحلیل WP و عامل‌های هوش مصنوعی برای حذف Boilerplate

یک ابزار جدید برای استنتاج مشخصات در Move Prover، تحلیل مکانیکی WP را با عامل‌های هوش مصنوعی از طریق پروتکل MCP ترکیب کرده است. این سیستم ترکیبی، تولید پیش‌شرط‌ها و پس‌شرط‌ها را…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا G-Zero نیاز به مدل‌های داور را در تکامل خودکار هوش مصنوعی حذف می‌کند؟

چارچوب G-Zero با حذف نیاز به مدل‌های داور خارجی، امکان تکامل خودکار مدل‌های زبانی در وظایف باز را فراهم می‌کند. این سیستم از طریق سازوکار Hint-δ، نقاط کور مدل را شناسایی کرده و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار TPAW: حذف وابستگی به داده‌های انسانی در همراستاسازی مدل‌های زبانی

الگوریتم TPAW با جایگزینی نظارت انسانی با یک چارچوب رقابتی تیمی میان نسخه‌های مختلف مدل، پایداری همراستاسازی را افزایش می‌دهد. این روش با استفاده از وزن‌دهی تطبیقی، مشکل تقویت…

۲ دقیقه خواندن