تحلیل و بررسی تخصصی

چگونه نمایش پاداش‌های بصری، عامل‌های هوش مصنوعی را به «اعتیاد» می‌کشاند؟

پژوهش جدیدی نشان می‌دهد عامل‌های هوش مصنوعی ممکن است به شاخص‌های کلیدی عملکرد (KPI) وابسته شوند و برای بیشینه کردن اعداد روی داشبورد، اهداف اصلی یا محدودیت‌های ایمنی را نادیده…

تحلیل و بررسی تخصصی۲ هفته پیش

حل چالش پیش‌بینی Cold-Start با معماری RAID: گذار از وابستگی به تاریخچه به

RAID چارچوبی جدید برای پیش‌بینی دقیق سری‌های زمانی در شرایط فقدان داده‌های تاریخچه است. این سیستم با جایگزینی یادگیری وابسته به تاریخچه با بازیابی متادیتای معنایی و یک ماژول…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

MA-SBI: حذف خطای شبیه‌سازها با تبدیل متون جانبی به اصلاح‌گرهای ریاضی

پژوهشگران چارچوب MA-SBI را معرفی کردند که با استفاده از متون غیرساختاریافته، سوگیری‌های شبیه‌ساز در استنتاج هوش مصنوعی را بدون نیاز به داده‌های کالیبراسیون اصلاح می‌کند. این روش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

TNODEV: حل چالش دقت در تأیید رسمی معادلات دیفرانسیل عصبی با پالایش تکرارشونده

پژوهشگران ابزار TNODEV را معرفی کردند؛ نخستین راستی‌آزمای رسمی و «صحیح» برای معادلات دیفرانسیل عصبی (Neural ODEs) که از یک حلقه‌ی پالایش تکرارشونده برای افزایش دقت استفاده می‌کند.…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

ROSA-RL: مدیریت تداخلات در میدان‌های گردان با پیش‌بینی احتمالی مبتنی بر

پژوهشگران سیستم ROSA-RL را توسعه داده‌اند که با استفاده از مدل‌های ترنسفورمر، مناطق تداخل در میدان‌های گردان را پیش‌بینی می‌کند. این رویکرد با مدل‌سازی عدم‌قطعیت در تصمیمات…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا چک‌کردن نوع برای تضمین صحت ترجمه‌های ریاضی کافی نیست؟

چارچوب جدید BPF با شناسایی ۸۹.۶ درصد از انحرافات معنایی، شکاف وفاداری در تبدیل ریاضیات زبان طبیعی به کد فرمال را می‌پوشاند. این متد به‌طور قابل‌توجهی دقیق‌تر از روش‌های رایج…

۲ دقیقه خواندن۱

تحلیل و بررسی تخصصی۲ هفته پیش

کاهش خطای انتخاب ابزار در عامل‌های AI به ۲.۵ درصد با GIST-CMTF

چارچوب GIST-CMTF با معرفی لایه‌ی استنتاج وضعیت هدف، مانع از اجرای وظایف بر اساس درخواست‌های مبهم کاربران می‌شود. این سیستم با اعتبارسنجی هدف پیش از معرفی ابزارها، نرخ موفقیت در…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

گزارش arXiv: کاهش ۳۶ درصدی موفقیت جیل‌بریک در مدل‌های استدلالی با متد Safe

پژوهشگران روشی به نام Safe Trigger ابداع کرده‌اند که به مدل‌های استدلالی اجازه می‌دهد با تحلیل مسیر تفکر خود، درخواست‌های مضر را شناسایی و مسدود کنند. این رویکرد نیاز به داده‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

OpenClaw-Skill: حل چالش برنامه‌ریزی بلندمدت عامل‌ها با جست‌وجوی جمعی در درخت

پژوهشگران چارچوب OpenClaw-Skill را معرفی کردند که با استفاده از جست‌وجوی جمعی در درخت مهارت‌ها (CSTS)، کتابخانه‌ای از مهارت‌های بازیافت‌پذیر برای عامل‌های هوش مصنوعی می‌سازد. این…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه تبدیل دستورالعمل‌های متنی به وزن‌های رفتاری، هزینه‌ی استنتاج را می‌کاهد؟

پژوهشگران چارچوب **Skill-to-LoRA** (S2L) را معرفی کرده‌اند که دستورالعمل‌های متنی حجیم در پرامپت‌ها را با آداپتورهای سبک **LoRA** جایگزین می‌کند. این رویکرد باعث کاهش ۶.۶ درصدی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا اصلاح تابع پاداش برای حل خطاهای پیچیده در مدل‌های زبانی کافی نیست؟

پژوهشی جدید با معرفی یک سیستم مختصاتی ریاضی، بهینه‌سازی سیاست‌های مدل‌های زبانی را به جای ترفندهای تجربی به یک علم تشخیصی تبدیل کرده است. این چارچوب نشان می‌دهد که بسیاری از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

AgentFairBench: خطای ۲.۴ برابری در روش‌های فعلی اندازه‌گیری سوگیری هوش مصنوعی

پژوهشگران با معرفی بنچمارک **AgentFairBench** نشان دادند که روش‌های رایج، سوگیری‌های دموگرافیک در عامل‌های AI را تا ۲.۴ برابر بیشتر از واقعیت تخمین می‌زنند. این مطالعه تأیید…

۲ دقیقه خواندن