تحلیل و بررسی تخصصی

سازوکار MAGE: تکامل عامل‌های هوش مصنوعی بدون به‌روزرسانی وزن‌های مدل

چارچوب MAGE با معرفی گراف‌های دانش تکاملی، به عامل‌های هوش مصنوعی اجازه می‌دهد بدون تغییر در وزن‌های مدل، از شکست‌ها و موفقیت‌های خود بیاموزند. این سیستم در ۹ بنچمارک مختلف، از…

تحلیل و بررسی تخصصی۲ ماه پیش

درون معماری GW-Eyes: گذار از ابزارهای کمکی به عامل‌های خودگردان در اخترشناسی

پژوهشگران چارچوب GW-Eyes را معرفی کردند؛ سیستمی عامل‌محور که با استفاده از مدل‌های زبانی بزرگ، پیوند میان امواج گرانشی و همتای‌های الکترومغناطیسی آن‌ها را خودکار می‌کند. این…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار Metis: چگونه یک حلقه فراشناختی سدهای امنیتی GPT-5 و O1 را می‌شکند؟

چارچوب جدیدی به نام Metis با استفاده از یک حلقه فراشناختی تکاملی، توانسته است با نرخ موفقیت ۸۹.۲ درصد از سدهای امنیتی مدل‌های پیشرو عبور کند. این سیستم به‌طور ویژه مدل‌های GPT-5 و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا تسلط زبانی در مدل‌های چندوجهی، نشانهٔ درک درست از تصاویر ماهواره‌ای نیست؟

پژوهشگران با معرفی بنچمارک SenseBench دریافتند که مدل‌های بینایی-زبانی در تحلیل تصاویر ماهواره‌ای دچار «توهم روانی» هستند. این مدل‌ها توصیفاتی بسیار متقاعدکننده اما از نظر فیزیکی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

گزارش arxiv.org: شکست کامل SafeLoRA در برابر استاندارد چهارگانه Acceptance Cards

پژوهشگران پروتکل سخت‌گیرانه Acceptance Cards را برای تأیید دفاع‌های تنظیم دقیق معرفی کردند. نتایج اولیه نشان می‌دهد SafeLoRA در مدل Gemma-2-2B-it شکست خورده و ادعاهای ایمنی فعلی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

ThreatCore: چرا تشخیص «قصد آسیب» دشوارتر از شناسایی کلمات رکیک است؟

پژوهشگران با معرفی بنچمارک ThreatCore نشان دادند که مدل‌های زبانی بزرگ در شناسایی تهدیدات غیرمستقیم ضعف شدیدی دارند. این مطالعه پیشنهاد می‌کند که استفاده از برچسب‌گذاری نقش معنایی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

حل چالش توزیع دم‌دراز در مدل‌های چندوجهی با رویکرد وزن‌دهی پویا

پژوهشگران چارچوب جدیدی برای رفع عدم توازن کلاس‌ها در هوش مصنوعی چندوجهی معرفی کرده‌اند. این مدل با وزن‌دهی پویا به منابع داده، سوگیری به سمت کلاس‌های اکثریت را کاهش و دقت شناسایی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

درون معماری HH-SAE: تفکیک سه لایه‌ای برای شکار سیگنال‌های نادر در داده‌های حجیم

پژوهشگران با معرفی مدل HH-SAE توانستند با تفکیک داده‌ها به سه سطح زمینه‌ای، اتمی و ترکیبی، دقت تشخیص کلاهبرداری را به ۰.۹۱۵۶ برسانند. این مدل با حل مشکل «تضاد تراکم ویژگی‌ها»،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا قوانین مقیاس‌پذیری در حذف کلیشه‌های اجتماعی مدل‌های زبانی شکست می‌خورند؟

پژوهش جدید StereoTales نشان می‌دهد تمام مدل‌های زبانی بزرگ، بدون توجه به اندازه یا سازنده، در تولید داستان‌های باز، کلیشه‌های مضر اجتماعی را بازتولید می‌کنند. این سوگیری‌ها ایستا…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا میانگین دقت در مدل‌های پزشکی، حقیقتِ شکست‌های پنهان را می‌پوشاند؟

چارچوب جدید FairDRO با هدف قرار دادن «شکست‌های پنهان درون‌گروهی»، دقت مدل‌های بخش‌بندی تصاویر پزشکی را در بدترین سناریوها تا ۷.۴٪ بهبود بخشیده است. این رویکرد به‌جای تکیه بر…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

حذف سد خطای فاکتوریزاسیون در مدل‌های انتشار ماسک‌دار با رویکرد IMDM

مدل جدید IMDM با معرفی ماسک‌های تصادفی، محدودیت‌های نظری تولید سریع در مدل‌های انتشار ماسک‌دار (MDM) را از بین برد. این دستاورد باعث افزایش چشمگیر سرعت نمونه‌برداری بدون کاهش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

کاهش زمان تأیید شبکه‌های عصبی آنالوگ از چند روز به چند ثانیه

پژوهشگران با جایگزینی شبیه‌سازی‌های کند مونت‌کارلو با تحلیل دسترسی مبتنی بر زونوتوپ‌های چندجمله‌ای، زمان تأیید سخت‌افزارهای هوش مصنوعی آنالوگ را به‌شدت کاهش داده‌اند. این روش…

۲ دقیقه خواندن