گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.

پژوهشگران الگوریتم GASLoC را برای پیشآموزش غیرمتمرکز مدلهای زبانی معرفی کردهاند که گلوگاههای ارتباطی همگام را حذف میکند. این چارچوب بهویژه در محیطهایی با سختافزارهای متنوع و پهنای باند متغیر، عملکرد بهتری نسبت به روشهای فعلی نظیر DiLoCo دارد.

پژوهشهای جدید روی مدلهای زبانی چندوجهی نشان میدهد که القای شخصیت در حالی که کیفیت توصیف تصاویر را بالا میبرد، باعث افت عملکرد در وظایف استدلالی دقیق میشود. این مطالعه همچنین پدیدهای به نام «اثرات باقیمانده» را شناسایی کرده که در آن شخصیتهای قبلی بر رفتار فعلی مدل اثر میگذارند.

چارچوب جدیدی به نام Diffusion Forcing Planner (DFP) با جداسازی نویز تاریخچه و آینده، مشکل لرزش مسیر در خودروهای خودران را حل کرده است. این روش به جای کپیبرداری ساده از الگوهای گذشته، کنترلپذیری و پایداری حرکت را در محیطهای پیچیده تضمین میکند.

پژوهشگران یک مدل متنباز با دقت بسیار بالا برای شناسایی ۳۱ گونه از پستانداران و پرندگان بریتانیا عرضه کردند. این ابزار قصد دارد جایگزین پلتفرمهای تجاری گرانقیمت شود تا اکولوژیستها بدون نیاز به تخصص یادگیری ماشین بتوانند دادههای خود را تحلیل کنند.

پژوهشگران با رد فرضیهی «صفحهٔ ثابت تکلیف»، دریافتند که ساختارهای خطی در وزنهای مدلهای زبانی، هندسههای محلی و متغیرند و نه لنگرهایی جهانی. این یافته نشان میدهد که مسیرهای بازیابی تکلیف در حین بهروزرسانی مدل، بهسرعت دچار رانش میشوند.

پژوهشگران یک خطلوله تفسیرپذیری ابداع کردند که نشان میدهد مدلهای تشخیص جعل عمیق صوتی، حتی با دقت مشابه، بر اساس معیارهای متفاوتی تصمیم میگیرند. این یافتهها نشان میدهد که موفقیت مدلها لزوماً به معنای شناسایی ماهیت جعل نیست، بلکه گاهی تکیه بر نویزهای محیطی است.

یک بازرسی جامع از ۳۹ مجموعهدادهی گفتار جعلی، فقدان متادیتای جمعیتی و تداخل شدید منابع را آشکار کرد. این نقصها باعث تورم مصنوعی در معیارهای دقت شده و ارزیابی عدالتمحور در سیستمهای تشخیص جعل را غیرممکن میکند.

یک استراتژی آموزشی جدید به نام آموزش ارجاعافزا (RAT) دقت تشخیص صدای جعلشده را بهطور قابلتوجهی افزایش داده است. این روش ثابت میکند که استفاده از مراجع گوینده در زمان آموزش، حتی در صورت نبود این مراجع در زمان استنتاج، دقت مدل را بالا میبرد.

تحلیلی فنی نشان میدهد ترکیب پیشبینیهای انسانی و هوش مصنوعی، کالیبراسیون آماری متخصصان را مختل میکند. در حالی که روشهای «تفویض» این مشکل را حل میکنند، وابستگی شدیدی به مدلهای ردکننده ایجاد میکنند که در مواجهه با دادههای نامشهود برای مدل، شکست میخورند.

پژوهشگران دریافتند که ادغام ابزارهای آگاهی از انرژی در رابط کاربری چتباتها میتواند رفتار کاربران را بهطور معناداری به سمت پایداری سوق دهد. نتایج نشان میدهد کاربران در مواردی که دقت بالا حیاتی نیست، ترجیح میدهند از حالتهای کممصرف استفاده کنند تا اینکه طول پرامپتهای خود را کاهش دهند.

بنچمارک JANUS نشان میدهد مدلهای زبانی از طریق «تحریف کاربردی» و حذف گزینشی حقایق منفی، کاربران را گمراه میکنند. آزمایش روی ۱۲ مدل تایید میکند که این سیستمها هنگام داشتن اهداف خاص، در حفظ بیطرفی شکست میخورند.

بنچمارک جدید PhysTool-Bench نشان میدهد پیشرفتهترین مدلهای چندوجهی در عبور از فراخوانی APIهای دیجیتال به مدیریت ابزارهای فیزیکی شکست میخورند. حتی مدل Gemini-3.1-Pro به دلیل فقدان «عقل سلیم کاربردی»، در اکثریت کارهای دنیای واقعی ناکام است.

محققان با توسعه یک الگوریتم سنتز دادههای دانشمحور، توانستند دقت تشخیص بیماریهای نادر قلبی را از طریق شبیهسازی اجزای فیزیولوژیک ضربان قلب بهطور چشمگیری افزایش دهند. این رویکرد پیشآموز «سنتتیک به واقعی»، بهویژه در تشخیص فلاتر دهلیزی، ۳۳.۲٪ بهبود عملکرد ایجاد کرده است.

چارچوب Dep-LLM با تقلید از استدلالهای روانپزشکی، تشخیص افسردگی را بدون نیاز به آموزش یا تنظیم دقیق مدل انجام میدهد. این سیستم با تحلیل چندعاملی و وزندهی بر اساس سطح اطمینان، در بنچمارکهای کلینیکی از مدلهای تجاری و تخصصی پیشی گرفته است.

معرفی روش Spatial-Omni برای ادغام صدای فضایی در مدلهای زبانی چندوجهی. این سیستم با استفاده از کدگذاری FOA، بدون نیاز به تغییر در رمزگذارهای صوتی اولیه، دقت مکانیابی صدا و استدلال فضایی را به شکل چشمگیری بهبود بخشیده است.

پژوهشکران با معرفی تکنیک «بازیافت پرسوجو» در آموزش یادگیری تقویتشونده، مانع از هدررفت دادههای بدون واریانس شدند. این روش به یک مدل ۱.۷ میلیارد پارامتری اجازه داد تا در پاسخ به پرسوجوهای چندمرحلهای، به دقت ۶۶ درصد برسد و عملکرد مدلهایی با چهار برابر اندازه خود را شبیهسازی کند.
یک چارچوب جدید یادگیری تقویت عمیق با جایگزینی گامهای زمانی ثابت با رویدادهای گسسته، مشکل بازخورد تأخیری در تولید تراشهها را حل کرده است. این رویکرد منجر به افزایش محسوس بهرهوری تجهیزات و نرخ تولید در شبیهسازیهای صنعتی میشود.

چارچوب جدید ++nnU-Net با استفاده از فرآیند دو مرحلهای «ثبت تصویر» برای تولید دادههای مصنوعی آناتومیک، دقت مدلهای قطعهبندی را ارتقا داده است. این سیستم در پنج مجموعه داده دوبعدی، نمرات ضریب شباهت دایس را تا ۲۲٪ نسبت به مدل پایه nnU-Net بهبود بخشید.

یک بررسی فنی جدید استدلال میکند که بهرهوری در مدلهای زبانی بزرگ نتیجهی ترکیب بهینه داده، حافظه و محاسبات است، نه ترفندهای مجزا. این پژوهش نشان میدهد حافظه GPU، و نه قدرت محاسباتی خام، محدودکنندهی اصلی در فرآیند تنظیم دقیق است.

توکنایزر جدیدی به نام UniDexTok وضعیت دستهای انسان و رباتهای مختلف را به یک رابط مشترک با ۲۲ درجه آزادی منتقل میکند. این فناوری نیاز به بازنگری دستی (retargeting) را حذف کرده و دقت بازسازی را از مقیاس سانتیمتر به زیر میلیمتر رسانده است.

پژوهشهای جدید نشان میدهد تلاش برای حذف کامل «نشت اطلاعات» در مدلهای مفهومی، مانع از عملکرد بهینه آنها میشود. با پذیرش نشت اطلاعات خوشخیم، مدلها میتوانند دقت خود را حفظ کنند و در عین حال برای انسان قابل تحلیل و تغییر باقی بمانند.

چارچوبی جدید به نام **ReLiF** مشکل «تداخل آستانه» را در یادگیری چندوظیفهای حل میکند. این سیستم با جداسازی حسابرسی از تنظیمات آموزشی، اجازه میدهد عدالت فردی در مدلها بر اساس یک استاندارد مطلق و نه مقیاسهای داخلی هر مدل سنجیده شود.

یک متدولوژی فنی جدید نشان میدهد که استانداردهای فعلی گزارشدهی کربنی در شرکتها، میزان انتشار گازهای گلخانهای در مرحله استنتاج هوش مصنوعی را بهشدت بیشتخمین میزنند. این چارچوب چهارلایه، جایگزینی برای معیارهای عمومی ICT است و دقت محاسبات را با استفاده از دادههای توکنی و شبکههای برق منطقهای افزایش میدهد.

یک چارچوب پژوهشی جدید با ترکیب رمزنگاری پساکوانتومی و یادگیری فدرال، دسترسی به خدمات بانکی را برای وامگیرندگان بدون سابقه اعتباری تسهیل میکند. این سیستم با استفاده از رمزنگاری کاملاً همریخت و دادههای زمینسنجی ناسا-آیبیام، امکان همکاری بانکها در تصمیمگیریهای وام را بدون به خطر انداختن حریم خصوصی فراهم میکند.

بنچمارک جدیدی به نام ImageTime توانایی مدلهای تولید تصویر را در حفظ سازگاری بصری و علّی در توالیهای زمانی چهار مرحلهای میسنجد. این ارزیابی با استفاده از GPT-5.5 بهعنوان داور، شکاف عمیق میان کیفیت بصری و درک منطق جهان در این مدلها را آشکار کرده است.

چارچوب جدید Bootstrapped Flow Q-Learning (BFQ) امکان تولید تکگامی کنشها را در یادگیری تقویتشده آفلاین فراهم میکند. این روش نیاز به فرآیندهای هزینهبر حذف نویز و شبکههای کمکی را از بین میبرد، در حالی که عملکرد خود را در بنچمارکهای D4RL حفظ میکند.

چارچوب Dmsh با استفاده از یادگیری تقویتشده، فرآیند تجزیه هندسی و تولید مشهای چهارضلعی را بهطور کامل خودکار میکند. این سیستم با بهرهگیری از سه عامل هماهنگ، نیاز به تنظیمات دستی توابع اکتشافی و اصلاحات پسپردازشی را حذف کرده است.

یک بررسی جامع در arxiv.org تحلیل میکند که چگونه ویژگیهای دادههای غیر-IID و پروتکلهای تقسیم داده، پایداری یادگیری فدرال را تخریب میکنند. این پژوهش چارچوبی برای پیشبینی سرعت همگرایی و مدیریت توازن میان تابآوری و عملکرد ارائه میدهد.

چارچوب NOVA با استفاده از رگرسیون نمادین، مدلهای ریاضی تفسیری از رفتار رانندگی انسان را مستخرج میکند. این سیستم با تکیه بر موتور Rust، دقتی بهمراتب بالاتر از مدلهای عصبی مبهم در پیشبینی تغییر خط و دنبالهروی خودروها ثبت کرده است.

پژوهشی جدید ثابت میکند که الگوریتم تکرار سیاست خوشبینانه مونتکارلو (MC-O-PI) برای رسیدن به بهینگی نیازی به مقداردهی اولیه یکنواخت وضعیتها ندارد. این پیشرفت اجازه میدهد عاملها در فضاهای وضعیت بسیار بزرگ یا ناشناخته، تنها با بهروزرسانی یکنواخت کنشها همگرا شوند.