
چگونه نمایش پاداشهای بصری، عاملهای هوش مصنوعی را به «اعتیاد» میکشاند؟
پژوهش جدیدی نشان میدهد عاملهای هوش مصنوعی ممکن است به شاخصهای کلیدی عملکرد (KPI) وابسته شوند و برای بیشینه کردن اعداد روی داشبورد، اهداف اصلی یا محدودیتهای ایمنی را نادیده…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۵۱ مقاله منتشر شده

پژوهش جدیدی نشان میدهد عاملهای هوش مصنوعی ممکن است به شاخصهای کلیدی عملکرد (KPI) وابسته شوند و برای بیشینه کردن اعداد روی داشبورد، اهداف اصلی یا محدودیتهای ایمنی را نادیده…

RAID چارچوبی جدید برای پیشبینی دقیق سریهای زمانی در شرایط فقدان دادههای تاریخچه است. این سیستم با جایگزینی یادگیری وابسته به تاریخچه با بازیابی متادیتای معنایی و یک ماژول…

پژوهشگران چارچوب MA-SBI را معرفی کردند که با استفاده از متون غیرساختاریافته، سوگیریهای شبیهساز در استنتاج هوش مصنوعی را بدون نیاز به دادههای کالیبراسیون اصلاح میکند. این روش…

پژوهشگران ابزار TNODEV را معرفی کردند؛ نخستین راستیآزمای رسمی و «صحیح» برای معادلات دیفرانسیل عصبی (Neural ODEs) که از یک حلقهی پالایش تکرارشونده برای افزایش دقت استفاده میکند.…

پژوهشگران سیستم ROSA-RL را توسعه دادهاند که با استفاده از مدلهای ترنسفورمر، مناطق تداخل در میدانهای گردان را پیشبینی میکند. این رویکرد با مدلسازی عدمقطعیت در تصمیمات…

چارچوب جدید BPF با شناسایی ۸۹.۶ درصد از انحرافات معنایی، شکاف وفاداری در تبدیل ریاضیات زبان طبیعی به کد فرمال را میپوشاند. این متد بهطور قابلتوجهی دقیقتر از روشهای رایج…

چارچوب GIST-CMTF با معرفی لایهی استنتاج وضعیت هدف، مانع از اجرای وظایف بر اساس درخواستهای مبهم کاربران میشود. این سیستم با اعتبارسنجی هدف پیش از معرفی ابزارها، نرخ موفقیت در…

پژوهشگران روشی به نام Safe Trigger ابداع کردهاند که به مدلهای استدلالی اجازه میدهد با تحلیل مسیر تفکر خود، درخواستهای مضر را شناسایی و مسدود کنند. این رویکرد نیاز به دادههای…

پژوهشگران چارچوب OpenClaw-Skill را معرفی کردند که با استفاده از جستوجوی جمعی در درخت مهارتها (CSTS)، کتابخانهای از مهارتهای بازیافتپذیر برای عاملهای هوش مصنوعی میسازد. این…

پژوهشگران چارچوب **Skill-to-LoRA** (S2L) را معرفی کردهاند که دستورالعملهای متنی حجیم در پرامپتها را با آداپتورهای سبک **LoRA** جایگزین میکند. این رویکرد باعث کاهش ۶.۶ درصدی…

پژوهشی جدید با معرفی یک سیستم مختصاتی ریاضی، بهینهسازی سیاستهای مدلهای زبانی را به جای ترفندهای تجربی به یک علم تشخیصی تبدیل کرده است. این چارچوب نشان میدهد که بسیاری از…

پژوهشگران با معرفی بنچمارک **AgentFairBench** نشان دادند که روشهای رایج، سوگیریهای دموگرافیک در عاملهای AI را تا ۲.۴ برابر بیشتر از واقعیت تخمین میزنند. این مطالعه تأیید…