
متایادگیری، مشکل کمبود داده را در بهینهسازی آفلاین حل میکند
پژوهشگران چارچوب **OptBias** را معرفی کردند. این روش با تولید وظایف مصنوعی از **فرایند گاوسی** (Gaussian process) و یادگیری سوگیری بهینهسازی قابلاستفاده مجدد، حتی با دادههای…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۳۳ مقاله منتشر شده

پژوهشگران چارچوب **OptBias** را معرفی کردند. این روش با تولید وظایف مصنوعی از **فرایند گاوسی** (Gaussian process) و یادگیری سوگیری بهینهسازی قابلاستفاده مجدد، حتی با دادههای…

پژوهشگران SEATrack را معرفی کردهاند؛ یک ردیاب چندوجهی دومنظوره که با ادغام «راهنمای متقابل تطبیقی» و «تطبیق کمرتبه» به معضل توازن میان دقت و بهرهوری محاسباتی در تنظیم دقیق…

تِمپلیتفاز چارچوبی نوین برای کشف آسیبپذیریهای قالبهای گفتگو در مدلهای زبانی بزرگ است. این روش با نرخ موفقیت ۹۸.۲٪ و افت دقت تنها ۱.۱٪ عمل میکند و در برابر مدلهای تجاری نیز…

پژوهشگران معیار CodeRQ-Bench را معرفی کردهاند؛ اولین معیار ویژه ارزیابی کیفیت استدلال در وظایف برنامهنویسی. این معیار با تمرکز بر فرایندهای استدلال بهجای صرفاً صحت خروجی، شکاف…

پژوهشگران تلاش کردند ویژگیهای رفتاری را از طریق تقطیر به مدلهای زبانی کوچک منتقل کنند، اما نتایج اولیه مثبت (+۳۳.۹ درصدی MCAS و +۱۵.۳ درصدی HumanEval) ناشی از خطاهای روششناختی…

پژوهشگران دریافتند که اسناد هویتی در مدلهای زبانی، الگوهای هندسی خاصی در فضای فعالسازی ایجاد میکنند. یافتهها نشان میدهد محتوای معنایی اهمیت بیشتری نسبت به ساختار ظاهری دارد و…

محققان معیار جدیدی طراحی کردهاند که عوامل هوش مصنوعی را در فرآیندهای بهینهسازی مهندسی با شبیهسازهای صنعتی محک میزند. نتایج نشان میدهد مدلهای فعلی در مدیریت چالشهای پیچیده…

پژوهشگران چارچوب LogicEval را برای ارزیابی تکنیکهای تعمیر خودکار آسیبپذیریهای منطقی ارائه کردند. همراه با آن، مجموعه داده LogicDS متشکل از ۸۶ آسیبپذیری واقعی با شناسه CVE برای…

محققان روشی به نام CAAT معرفی کردهاند که تنها پارامترهای حیاتی برای مقاومت مدل را در ترانسفورمرهای بینایی تنظیم میکند. این روش با هدفگیری صرفاً ۶ درصد از پارامترها، به مقاومت…

پژوهش تازهای نشان میدهد که نمیتوان با استفاده از ویژگیهای ساختاری، مرز دقیق مسائل محاسباتی قابل حل را مشخص کرد. این تحقیق محدودیتهای بنیادینی را آشکار میسازد که درک ما از…

پژوهشگران معیار SLATE و الگوریتم EGB را برای بهبود اجرای برنامههای چندمرحلهای توسط مدلهای زبانی مجهز به ابزار معرفی کردند. این رویکرد جدید با تخصیص هوشمند منابع محاسباتی به…

پژوهشگران نشان دادهاند که ویژگیهایی مانند پایداری عددی و سازگاری فیزیکی مدلهای هوش مصنوعی پیش از آغاز آموزش قابل تأیید هستند. این رویکرد از بار محاسباتی انباشتهای که روشهای…