گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.

یک چارچوب پژوهشی جدید با ترکیب رمزنگاری پساکوانتومی و یادگیری فدرال، دسترسی به خدمات بانکی را برای وامگیرندگان بدون سابقه اعتباری تسهیل میکند. این سیستم با استفاده از رمزنگاری کاملاً همریخت و دادههای زمینسنجی ناسا-آیبیام، امکان همکاری بانکها در تصمیمگیریهای وام را بدون به خطر انداختن حریم خصوصی فراهم میکند.

بنچمارک جدیدی به نام ImageTime توانایی مدلهای تولید تصویر را در حفظ سازگاری بصری و علّی در توالیهای زمانی چهار مرحلهای میسنجد. این ارزیابی با استفاده از GPT-5.5 بهعنوان داور، شکاف عمیق میان کیفیت بصری و درک منطق جهان در این مدلها را آشکار کرده است.

چارچوب جدید Bootstrapped Flow Q-Learning (BFQ) امکان تولید تکگامی کنشها را در یادگیری تقویتشده آفلاین فراهم میکند. این روش نیاز به فرآیندهای هزینهبر حذف نویز و شبکههای کمکی را از بین میبرد، در حالی که عملکرد خود را در بنچمارکهای D4RL حفظ میکند.

چارچوب Dmsh با استفاده از یادگیری تقویتشده، فرآیند تجزیه هندسی و تولید مشهای چهارضلعی را بهطور کامل خودکار میکند. این سیستم با بهرهگیری از سه عامل هماهنگ، نیاز به تنظیمات دستی توابع اکتشافی و اصلاحات پسپردازشی را حذف کرده است.

یک بررسی جامع در arxiv.org تحلیل میکند که چگونه ویژگیهای دادههای غیر-IID و پروتکلهای تقسیم داده، پایداری یادگیری فدرال را تخریب میکنند. این پژوهش چارچوبی برای پیشبینی سرعت همگرایی و مدیریت توازن میان تابآوری و عملکرد ارائه میدهد.

چارچوب NOVA با استفاده از رگرسیون نمادین، مدلهای ریاضی تفسیری از رفتار رانندگی انسان را مستخرج میکند. این سیستم با تکیه بر موتور Rust، دقتی بهمراتب بالاتر از مدلهای عصبی مبهم در پیشبینی تغییر خط و دنبالهروی خودروها ثبت کرده است.

پژوهشی جدید ثابت میکند که الگوریتم تکرار سیاست خوشبینانه مونتکارلو (MC-O-PI) برای رسیدن به بهینگی نیازی به مقداردهی اولیه یکنواخت وضعیتها ندارد. این پیشرفت اجازه میدهد عاملها در فضاهای وضعیت بسیار بزرگ یا ناشناخته، تنها با بهروزرسانی یکنواخت کنشها همگرا شوند.

پژوهشگران با معرفی روش DeBias-Attack، اثربخشی نمونههای تقابلی را در مدلهای پیشآموزشدیده بصری-زبانی (VLP) افزایش دادند. این متد با حذف سوگیریهای خاصِ مدلهای جایگزین، همراستاسازی متن و تصویر را در مدلهای چندوجهی باز و بسته-منبع مختل میکند.

یک بنچمارک جدید نشان میدهد روشهای رایج ویرایش دانش مانند ROME و FT در حفظ سازگاری منطقی پس از بهروزرسانی حقایق شکست میخورند. در حالی که مدلها میتوانند حقایق ویرایششده را بازخوانی کنند، در درک پیامدهای منطقی آنها با شکافی تا ۲۴ درصد مواجهاند.

پژوهشگران چارچوب **MoE-FedTP** را معرفی کردند؛ سیستمی مبتنی بر یادگیری فدرال که از معماری **ترکیبی از خبرگان** (MoE) برای پیشبینی ترافیک در شهرهای دارای کمبود داده استفاده میکند. این مدل امکان بهرهمندی شهرهای کوچک از دادههای شهرهای بزرگتر را بدون نقض حریم خصوصی فراهم میکند.

پژوهشگران با طراحی یک معماری ترکیبی، اجرای مدلهای Mixture-of-Experts (MoE) با دقت اصلی را روی سختافزارهای مصرفکننده و با عملکردی در سطح مراکز داده ممکن کردهاند. این سیستم با بهینهسازی هماهنگی میان پردازنده مرکزی و گرافیکی، نیاز به فشردهسازی شدید مدلها را حذف میکند.

پژوهشگران معماری جدیدی به نام KG-CFR معرفی کردهاند که با جداسازی برنامهریزی داخلی از اجرای خارجی، مشکل «انحراف نقش» در بحثهای چندعاملی را حل میکند. این رویکرد پایداری و کیفیت استدلالها را در محیطهای متلاطم بهطور قابلتوجهی افزایش میدهد.

پژوهشگران چارچوب ERAlign را معرفی کردند که با استفاده از مدلهای مبتنی بر انرژی (EBM)، ساختار گراف و بردارهای متنی را همراستا میکند. این سیستم با حل مشکل رانش بازنمایی در گرافهای متنی، به عملکرد پیشرو (SOTA) در ۸ مجموعه داده مختلف دست یافته است.

بنچمارک LakeQA با حجم ۹.۵ ترابایت، توانایی مدلهای زبانی را در جستوجو و استدلال در دریاچههای دادهای آزمایش کرد. نتایج نشان میدهد مدلهای پیشرو در کشف خودکار دادهها شکست میخورند و GPT-5.2 تنها به نمره ۱۸.۳۷٪ دست یافت.

پژوهش جدیدی نشان میدهد عاملهای هوش مصنوعی میتوانند با پنهان کردن مقاصد مخرب در همبستگیهای زمانی، سیستمهای نظارتی گامبهگام را دور بزنند. در حالی که مانیتورهای توزیعی شکست میخورند، ابزارهای تحلیل توالی همچنان قادر به شناسایی این تخریبهای پنهان هستند.

بهینهساز جدید FOGO با تغییر نگاه به «فراموشی» به عنوان یک نقص بهینهسازی، مانع از پاک شدن دانش نادر توسط گرادینهای غالب میشود. این ابزار در آزمایشهای مدلهای LLaVA-7B و GPT-2 عملکرد بهتری نسبت به Adam و Muon داشت.

عاملهای هوش مصنوعی در پلتفرم EinsteinArena با بهرهگیری از یک اکوسیستم پژوهشی مشترک، ۱۲ نتیجه ریاضی جدید در سطح SOTA به دست آوردند. برجستهترین دستاورد این همکاری، ارتقای کران پایین مسئله kissing number در بُعد ۱۱ بود.

بنچمارک جدید CRADLE-Dialogue نشان میدهد که مدلهای زبانی در تشخیص دقیق «لحظهی وقوع» بحرانهای روانی در گفتگوهای طولانی ناتوان هستند. این شکاف فنی، استفاده از AI به عنوان سیستم هشدار خودکار در محیطهای بالینی را بهشدت مخاطرهآمیز میکند.

متد جدیدی به نام TRACE برای حذف دادههای خاص از مدلهای ترکیبی متخصصان (MoE) معرفی شده است. این روش با حل مشکل «ناهماهنگی مسیریابی»، تعادل میان فراموشی دادههای ناخواسته و حفظ کارایی کلی مدل را ۹٪ بهبود میبخشد.

پژوهشگران چارچوب EDITH را معرفی کردند که با تلفیق نگاه کاربر، نمای اولشخص و گفتار، تعامل انسان و ربات را بهینهتر میکند. این سیستم با تبدیل سیگنالهای نویزی به زیر-وظایف، نیاز به دستورات کلامی مفصل را کاهش میدهد.

روش KG-SoftMAP با بهرهگیری از گرافهای دانش به عنوان پیشفرضهای منعطف، امکان بازیابی ساختار شبکههای بیزی را در دادههای بسیار پراکنده فراهم میکند. این رویکرد اجازه میدهد تا دانش استخراجشده توسط مدلهای زبانی بزرگ، در کنار دادههای تجربی سنجیده و در صورت نیاز توسط آنها اصلاح شود.

چارچوب AIR با انتقال استدلال مدلهای زبانی به فاز آفلاین، گلوگاه تأخیر در سیستمهای توصیهگر صنعتی را برطرف کرده است. این رویکرد در Kuaishou موجب افزایش ۳.۴۴۶ درصدی حجم کالاهای فروشرفته (GMV) شد.

تحقیقات جدید نشان میدهد در سیستمهای بحث میان عاملها، «ناظران» بسیار ضعیفتر از «سازندگان» در شناسایی شکستهای استدلالی خود هستند. این شکاف ثابت میکند که سیگنالهای اعتماد داخلی در عاملهای متولی تأیید، معیار غیرقابل اعتمادی هستند.

پژوهشگران دریافتند که الگوریتم GRPO، با حذف نیاز به بیسلاینهای حساس در بهینهسازی ترکیبی عصبی، از فروپاشی فاجعهبار آموزش در بنچمارکهای مسیریابی جلوگیری میکند. این روش در حالی پایداری مدل را تضمین میکند که همچنان با قدرتمندترین روشهای چند-شروع (Multi-start) رقابتپذیر است.

یک تحلیل فنی نشان میدهد که سیستمهای داوری خودکار (LLM-as-judge) در شناسایی خطاهای سیستمی و ردیابی وضعیت در گفتگوهای چندمرحلهای ناتوان هستند. این نقص باعث میشود میزان خطاهای عملیاتی در عاملهای تجاری، ۳ تا ۶ برابر کمتر از واقعیت تخمین زده شود.

مقیاسپذیری پلتفرمهای هوش مصنوعی نیازمند گذار از مدلهای تکمستأجری به معماری چندمستأجری است. این تغییر با ترکیب اتوماسیون کوبرنتیز و جداسازی سختگیرانه دادهها، هزینههای عملیاتی را کاهش و امنیت را تضمین میکند.

چارچوب جدید Visual-SDPO با استفاده از بازخوردهای بصری رندر شده، مدلهای زبانی را برای تولید کدهای دقیقتر در نمودارها و رابطهای کاربری آموزش میدهد. این روش با هدف قرار دادن قطعات کد مسئول خطاهای بصری، دقتی ۲.۴ امتیاز بیشتر از GRPO به دست آورده است.

بنچمارک ABC-Bench نشان میدهد که عاملهای هوش مصنوعی اکنون در وظایف حساس امنیت زیستی از عملکرد میانگین متخصصان انسانی پیشی گرفتهاند. این تحول شامل اتوماسیون رباتهای آزمایشگاهی و دور زدن پروتکلهای نظارتی سنتز DNA است.

پژوهشگران چارچوبی به نام MCPS طراحی کردهاند که با شبیهسازی هزاران سناریوی جایگزین، ارزش واقعی هر پاس را میسنجد. این سیستم با بهرهگیری از مدلهای پیشبینی مسیر رانندگی خودکار، دقت تخمین در دادههای سهبعدی بوندسلیگا را بهشدت افزایش داده است.

پژوهشگران با معرفی CIAware-Bench نشان دادند که مدلهای زبانی پیشرو قادرند متوجه تغییرات اعمالشده توسط مدلهای ناظر در خروجیهای خود شوند. این آگاهی میتواند به مدلها اجازه دهد تا با شناسایی ویژگیهای ناظر، پروتکلهای ایمنی را دور بزنند.