تحلیل و بررسی تخصصی

متایادگیری، مشکل کمبود داده را در بهینه‌سازی آفلاین حل می‌کند

پژوهشگران چارچوب **OptBias** را معرفی کردند. این روش با تولید وظایف مصنوعی از **فرایند گاوسی** (Gaussian process) و یادگیری سوگیری بهینه‌سازی قابل‌استفاده مجدد، حتی با داده‌های…

تحلیل و بررسی تخصصی۲ ماه پیش

SEATrack؛ راهکاری نوین برای موازنه عملکرد و بهره‌وری در ردیابی چندوجهی

پژوهشگران SEATrack را معرفی کرده‌اند؛ یک ردیاب چندوجهی دومنظوره که با ادغام «راهنمای متقابل تطبیقی» و «تطبیق کم‌رتبه» به معضل توازن میان دقت و بهره‌وری محاسباتی در تنظیم دقیق…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تِمپلیت‌فاز: چارچوب فازینگ دقیق برای نفوذ به مدل‌های زبانی بزرگ

تِمپلیت‌فاز چارچوبی نوین برای کشف آسیب‌پذیری‌های قالب‌های گفتگو در مدل‌های زبانی بزرگ است. این روش با نرخ موفقیت ۹۸.۲٪ و افت دقت تنها ۱.۱٪ عمل می‌کند و در برابر مدل‌های تجاری نیز…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

فراتر از صحت خروجی: ارزیابی استدلال مدل‌های زبانی در کدنویسی

پژوهشگران معیار CodeRQ-Bench را معرفی کرده‌اند؛ اولین معیار ویژه ارزیابی کیفیت استدلال در وظایف برنامه‌نویسی. این معیار با تمرکز بر فرایندهای استدلال به‌جای صرفاً صحت خروجی، شکاف…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

استخراج ویژگی‌های رفتاری در مدل‌های زبانی کوچک با شکست مواجه شد

پژوهشگران تلاش کردند ویژگی‌های رفتاری را از طریق تقطیر به مدل‌های زبانی کوچک منتقل کنند، اما نتایج اولیه مثبت (+۳۳.۹ درصدی MCAS و +۱۵.۳ درصدی HumanEval) ناشی از خطاهای روش‌شناختی…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

اسناد هویتی الگوهای جاذبی در فضای فعال‌سازی مدل‌های زبانی ایجاد می‌کنند

پژوهشگران دریافتند که اسناد هویتی در مدل‌های زبانی، الگوهای هندسی خاصی در فضای فعال‌سازی ایجاد می‌کنند. یافته‌ها نشان می‌دهد محتوای معنایی اهمیت بیشتری نسبت به ساختار ظاهری دارد و…

۱ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

فرانتیر-انگ: معیار ارزیابی عوامل خودتکاملی در وظایف مهندسی

محققان معیار جدیدی طراحی کرده‌اند که عوامل هوش مصنوعی را در فرآیندهای بهینه‌سازی مهندسی با شبیه‌سازهای صنعتی محک می‌زند. نتایج نشان می‌دهد مدل‌های فعلی در مدیریت چالش‌های پیچیده…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

LogicEval: ارزیابی تعمیر خودکار آسیب‌پذیری‌های منطقی

پژوهشگران چارچوب LogicEval را برای ارزیابی تکنیک‌های تعمیر خودکار آسیب‌پذیری‌های منطقی ارائه کردند. همراه با آن، مجموعه داده LogicDS متشکل از ۸۶ آسیب‌پذیری واقعی با شناسه CVE برای…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

روش جدید هزینه آموزش تخاصمی ترانسفورمرهای بینایی را کاهش می‌دهد

محققان روشی به نام CAAT معرفی کرده‌اند که تنها پارامترهای حیاتی برای مقاومت مدل را در ترانسفورمرهای بینایی تنظیم می‌کند. این روش با هدف‌گیری صرفاً ۶ درصد از پارامترها، به مقاومت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

انتزاع ساختاری و خطوط مرزی محاسبات قابل حل

پژوهش تازه‌ای نشان می‌دهد که نمی‌توان با استفاده از ویژگی‌های ساختاری، مرز دقیق مسائل محاسباتی قابل حل را مشخص کرد. این تحقیق محدودیت‌های بنیادینی را آشکار می‌سازد که درک ما از…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

الگوریتم شاخه‌بندی آنتروپی‌محور عملکرد عوامل هوش مصنوعی را بهبود می‌دهد

پژوهشگران معیار SLATE و الگوریتم EGB را برای بهبود اجرای برنامه‌های چندمرحله‌ای توسط مدل‌های زبانی مجهز به ابزار معرفی کردند. این رویکرد جدید با تخصیص هوشمند منابع محاسباتی به…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

تأیید هوش مصنوعی در مرحله طراحی، نیاز به بررسی پس از استقرار را حذف می‌کند

پژوهشگران نشان داده‌اند که ویژگی‌هایی مانند پایداری عددی و سازگاری فیزیکی مدل‌های هوش مصنوعی پیش از آغاز آموزش قابل تأیید هستند. این رویکرد از بار محاسباتی انباشته‌ای که روش‌های…

۲ دقیقه خواندن