گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.

پژوهشگران مجموعه داده PhysScene را معرفی کردند؛ نخستین گراف صحنه تخصصی برای محیطهای آزمایشگاهی فیزیک. هدف این پروژه تغییر تمرکز مدلها از روابط مکانی ساده به وابستگیهای عملکردی و منطقی ابزارهای علمی است.

پژوهشگران نوع جدیدی از حملات به نام «تزریق پرامپت مغزی» را شناسایی کردهاند که از طریق اختلال در سیگنالهای عصبی، عاملهای BCI-LLM را به کنترل درمیآورد. این مطالعه ثابت میکند که امنیت این سامانهها را باید در گزارشهای مسیر (Route Logs) جستوجو کرد، نه در دقت دکودرهای عصبی.

پژوهشگران با معرفی PyGeoX و مکانیزم پاداش SAR، نرخ موفقیت مدلهای زبانی در حل مسائل پیچیده هندسی را ۲.۳ برابر کردند. این روش با جلوگیری از «پوشش گرادیانهای پرت»، مانع از توهم مدل در طراحیهای حساس به دقت میشود.

پژوهشگران با توسعه MetaSeq، طراحی متامتریالهای آکوستیک را به یک مسئله توالی-به-توالی تبدیل کردهاند. این سیستم با جایگزینی نمایشهای پیکسلی با یک زبان توالیمحورِ مبتنی بر فیزیک، دقت هندسی را بهشدت افزایش و خطاهای پاسخ در طراحیهای پهنباند را ۴۵٪ کاهش داده است.

پژوهشگران چارچوبی به نام BSTabDiff را برای تولید دادههای جدولی مصنوعی در حوزههایی که تعداد ویژگیها بسیار بیشتر از نمونههاست، توسعه دادهاند. این سیستم با استفاده از پیشفرضهای انتشار بلوکی، سنتزی پایدارتر و واقعگرایانهتری نسبت به تولیدکنندههای بدون ساختار ارائه میدهد.

پژوهشگران روشی برای همپوشانی (Overlap) محاسبات و ارتباطات در محیطهای چند-GPU ابداع کردهاند که زمان اجرای کل را تا ۲۵.۵٪ کاهش میدهد. این دستاورد بدون تغییر در کتابخانههای سختافزاری و تنها با مدیریت بهینه حافظه مشترک حاصل شده است.

یک رویکرد جدید در تشخیص اشیاء کمنمونه (FSOD) با اصلاح عدمتوازن بین پیشنهادهای کلاسهای پایه و جدید، دقت مدلها را ۱ تا ۶ درصد افزایش داده است. این روش بدون ایجاد تأخیر در زمان استنتاج، کیفیت کاندیداهای ناحیهای را بهبود میبخشد.

پژوهشگران دریافتند که مدلهای بنیادی EEG حتی پس از عبور از بازرسیهای امنیتی، همچنان ویژگیهای طیفی حساس را فاش میکنند. این مطالعه با معرفی یک چارچوب بازرسی مشترک، ناکارآمدی دفاعهای فعلی از جمله DP-SGD را در برابر انتقال ویژگیها به اثبات رساند.

پژوهشگران چارچوب EgoTactile را معرفی کردند که میتواند فشار گیرش دست را تنها از طریق ویدیوهای اولشخص تخمین بزند. این سیستم با استفاده از مدلهای انتشار، نیاز به سختافزارهای لمسی حجیم را برای تعامل با اشیاء سهبعدی پیچیده حذف میکند.

ترجمهٔ مستقیم بنچمارکهای ایمنی انگلیسی برای شناسایی آسیبپذیریهای مدلهای زبانی در محیطهای آسیایی ناکارآمد است. مطالعهای جدید ثابت میکند که رِد-تیمینگ متناسب با فرهنگهای بومی، نرخ موفقیت حملات را در زبانهای شرق آسیا بهطور معناداری افزایش میدهد.

پژوهشگران با ترکیب یادگیری تقویتشدهی SAC و یک برنامه آموزشی خودگردان (SPDL)، سیستمی برای آموزش موتورسیکلتهای مسابقهای خودران توسعه دادهاند. این رویکرد نیاز به طراحی دستی مراحل آموزش را حذف کرده و پایداری و سرعت پیمایش در شبیهساز VRider SBK را بهبود بخشیده است.

پژوهشگران با معرفی چارچوب Uni-E توانستند شکاف عملکرد میان مدلهای انتشار زبانی و مدلهای خودرگرسیونی را کاهش دهند. این روش با جایگزینی تخمینهای احتمالی با محاسبات دقیق انرژی، مشکل وابستگی توکنها و ناپایداری توزیع را حل میکند.

چارچوب CANS با استفاده از یادگیری مشارکتی، تأخیر در استنتاج مدلهای هوش مصنوعی در شبکههای لبهای را تا ۵۰ درصد کاهش میدهد. این راهکار با بهینهسازی پویا در تقسیمبندی مدلها، محدودیتهای سختافزاری دستگاههای مختلف را مدیریت میکند.

پژوهشی جدید با معرفی چارچوب SEF-CLGC نشان میدهد که ادغام منطق نمادین در مدلهای زبانی کوچک میتواند سوگیری محتوایی را کاهش دهد. این رویکرد در آزمونهای SemEval-2026 به دقت ۲۷.۸۰ درصدی در تفکیک محتوا از استدلال دست یافت.

پژوهشگران با تنظیم دقیق مدل Qwen3-VL-2B و ادغام دادههای مربوط به نگاه چشم و حرکت خودرو، رکورد جدیدی در پیشبینی قصد عابر پیاده ثبت کردند. این روش بر معماریهای تخصصی ترنسفورمری غلبه کرده و مسیر جدیدی برای ایمنی خودروهای خودران میگشاید.

پژوهشگران روشی را کشف کردهاند که اجازه میدهد پیامهای مخفی ۳۲ بیتی را بدون تغییر در وزنهای مدل، تنها با دستکاری بذرهای تصادفی در خروجیهای LLM جایگذاری کنند. این متد حتی بدون دسترسی به پرامپت اصلی، بازیابی تقریباً کامل دادهها را ممکن میسازد.

مدلهای زبانی بزرگ اکنون میتوانند بدون هیچ آموزشی، اشیاء محیطهای سهبعدی را با دقت ۹۶ درصد به کلاسهای هستیشناسی متصل کنند. این روش با بهرهگیری از نشانههای معنایی در گراف صحنه، متدهای سنتی مبتنی بر لغتنامه را به شدت شکست میدهد.

شکستهای زیرساختی ابر اکنون سریعتر از واکنش انسانها رخ میدهند. یک معماری جدید هوش مصنوعی عاملمحور در یکی از ارائهدهندگان بزرگ ابر، اکنون بیش از ۹۰ درصد از حوادث رایج شبکه را بهصورت خودکار حل میکند.

پژوهشگران با ترکیب «انتشار تعادلی» و دینامیک ایسینگ، راهکاری برای رفع خطاهای همگرایی در مدلهای انرژیمحور ابداع کردند. این رویکرد نوآورانه اجازه میدهد دقت این مدلها در بنچمارکهای تصویری با پسانتشار برابری کند، در حالی که نیاز به انرژی GPU بهطور قابلتوجهی کاهش مییابد.

پژوهشگران یک «شکاف منشأ» در عاملهای هوش مصنوعی شناسایی کردهاند که اجازه میدهد درخواستهای مضر در قالب فایلهای بهظاهر بیخطر پنهان شوند. متد جدید CFD با دور زدن فیلترهای متنی، نرخ موفقیت جیلبریک را بهطور چشمگیری افزایش میدهد.

الگوریتم جدید BAVAR-BLED با ترکیب مدلهای بیزی و توزیعهای بیضوی در یک معماری یادگیری تقویتشده، توانسته است بازدهی ۵۷.۲۶ درصدی را در سهام داوجونز ثبت کند. این سیستم با هدف mengatasi نقاط ضعف مدلهای فعلی در مواجهه با سقوطهای ناگهانی بازار و تغییر رژیمهای نوسانی طراحی شده است.

پژوهشی جدید نشان میدهد Nearly یکچهارم از مخازن کد که از تنظیمات متنی برای هدایت هوش مصنوعی استفاده میکنند، با دادههای منسوخ روبهرو هستند. این پدیده که «پوسیدگی متنی» نامیده میشود، ریسک توهم و خطاهای فنی را در محیطهای عملیاتی بهشدت افزایش میدهد.

معماری جدید FlashMemory-DeepSeek-V4 با معرفی سازوکار «توجه پراکنده پیشرو»، گلوگاه حافظه GPU را در پردازش متون طولانی برطرف کرده است. این متد بدون کاهش دقت، ردپای حافظه KV را به ۱۳.۵ درصد سطح پایه میرساند.

چارچوب OnlyDense با تغییر نگاه به سیستمهای ذرهای از نقاط گسسته به مسیرهایی در فضای هیلبرت، بازسازی دقیق دینامیکهای پیچیده را ممکن کرده است. این روش با ادغام مدلسازی کاهش-مرتبه کلاسیک و یادگیری عمیق، کارایی پیشبینی سیستمهای عظیم را بهطور چشمگیری افزایش میدهد.

چارچوب جدیدی به نام INFUSER با تغییر رویکرد از دادههای «سخت» به دادههای «مؤثر»، مدلهای هوش مصنوعی را قادر میسازد تا برنامه آموزشی خود را بهطور پویا تکامل دهند. این متد باعث بهبود ۲۰ درصدی عملکرد مدل Qwen3-8B در بنچمارکهای پیچیده استدلالی شده است.

یک مطالعه فنی روی مدلهای بینایی-زبانی نشان میدهد که انتخاب بین SFT و OPD در مرحله گرمبندی، تنها بر رژیم آنتروپی اولیه اثر میگذارد و تأثیری بر عملکرد نهایی یادگیری تقویتشده ندارد. این یافتهها ریسک بیشبرازش در تنظیم دقیق نظارتشده را به عنوان تهدیدی جدی برای تعمیمپذیری مدلها برجسته میکند.

چارچوب BareWave با حذف نمایشهای میانی و مراحل کدگشایی، امکان تولید مستقیم موجهای صوتی را از روی متن فراهم میکند. این رویکرد پیچیدگی مسیر استنتاج را کاهش داده و در عین حال کیفیت شبیهسازی صدا را حفظ میکند.

چارچوب SafeRun با جداسازی تفسیر زبان طبیعی از اجرای محدودیتهای سخت، ایمنی کامل در برنامهریزیهای ورزشی را تضمین میکند. این متد در بنچمارکهای جدید، عملکرد مهندسی پرامپت و روشهای کد-محور را با کسب امتیاز ۱۰۰ درصدی در ایمنی شکست داد.

چارچوب TRIAGE با جایگزینی پیشبینیهای باینری و بیشازحد مطمئن با امتیازات ریسک پیوسته، خطای کالیبراسیون در مدلهای زبانی بزرگ پزشکی را ۸۱٪ کاهش داده است. این رویکرد از طریق استدلال دیالکتیکی، کیفیت استدلال بالینی را برای تریاژ بیماران بهطور معناداری بهبود میبخشد.

پژوهشگران ابزاری به نام ATM را معرفی کردهاند که ارزیابی مدلهای جهانی نهفته را به جای اجرای کند شبیهسازها، با پروبهای سبک انجام میدهد. این متد با شناسایی سریع شکستهای بازنمایی، سرعت رتبهبندی چکپوینتهای مدل را ۱۰۰ برابر افزایش میدهد.