پرخواننده‌ترین‌ها

چرا GASLoC در آموزش مدل‌های زبانی بر سخت‌افزارهای ناهمگن از DiLoCo پیشی می‌گیرد؟

پژوهشگران الگوریتم GASLoC را برای پیش‌آموزش غیرمتمرکز مدل‌های زبانی معرفی کرده‌اند که گلوگاه‌های ارتباطی همگام را حذف می‌کند. این چارچوب به‌ویژه در محیط‌هایی با سخت‌افزارهای متنوع و پهنای باند متغیر، عملکرد بهتری نسبت به روش‌های فعلی نظیر DiLoCo دارد.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۲

تحلیل و بررسی تخصصی

چرا شخصیت‌بخشی در مدل‌های چندوجهی، دقت استدلال بصری را کاهش می‌دهد؟

پژوهش‌های جدید روی مدل‌های زبانی چندوجهی نشان می‌دهد که القای شخصیت در حالی که کیفیت توصیف تصاویر را بالا می‌برد، باعث افت عملکرد در وظایف استدلالی دقیق می‌شود. این مطالعه همچنین پدیده‌ای به نام «اثرات باقی‌مانده» را شناسایی کرده که در آن شخصیت‌های قبلی بر رفتار فعلی مدل اثر می‌گذارند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۳

تحلیل و بررسی تخصصی

تثبیت مسیرهای رانندگی خودکار با DFP: گذار از کپی‌برداری تاریخچه به کنترل پویا

چارچوب جدیدی به نام Diffusion Forcing Planner (DFP) با جداسازی نویز تاریخچه و آینده، مشکل لرزش مسیر در خودروهای خودران را حل کرده است. این روش به جای کپی‌برداری ساده از الگوهای گذشته، کنترل‌پذیری و پایداری حرکت را در محیط‌های پیچیده تضمین می‌کند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۴

آموزش کاربردی

دقت ۹۸.۴ درصدی YOLO26x؛ پایان پرداخت‌های ماهانه برای پایش حیات وحش

پژوهشگران یک مدل متن‌باز با دقت بسیار بالا برای شناسایی ۳۱ گونه از پستانداران و پرندگان بریتانیا عرضه کردند. این ابزار قصد دارد جایگزین پلتفرم‌های تجاری گران‌قیمت شود تا اکولوژیست‌ها بدون نیاز به تخصص یادگیری ماشین بتوانند داده‌های خود را تحلیل کنند.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۰۵

تحلیل و بررسی تخصصی

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

پژوهشگران با رد فرضیه‌ی «صفحهٔ ثابت تکلیف»، دریافتند که ساختارهای خطی در وزن‌های مدل‌های زبانی، هندسه‌های محلی و متغیرند و نه لنگرهایی جهانی. این یافته نشان می‌دهد که مسیرهای بازیابی تکلیف در حین به‌روزرسانی مدل، به‌سرعت دچار رانش می‌شوند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۶

تحلیل و بررسی تخصصی

چرا دقت یکسان در تشخیص جعل عمیق، حاصل سیگنال‌های متفاوتی است؟

پژوهشگران یک خط‌لوله تفسیرپذیری ابداع کردند که نشان می‌دهد مدل‌های تشخیص جعل عمیق صوتی، حتی با دقت مشابه، بر اساس معیارهای متفاوتی تصمیم می‌گیرند. این یافته‌ها نشان می‌دهد که موفقیت مدل‌ها لزوماً به معنای شناسایی ماهیت جعل نیست، بلکه گاهی تکیه بر نویزهای محیطی است.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۷

تحلیل و بررسی تخصصی

تداخل داده‌ای در ۳۹ مجموعه‌داده؛ دلیل متورم شدن دقت تشخیص جعل عمیق صوتی

یک بازرسی جامع از ۳۹ مجموعه‌داده‌ی گفتار جعلی، فقدان متادیتای جمعیتی و تداخل شدید منابع را آشکار کرد. این نقص‌ها باعث تورم مصنوعی در معیارهای دقت شده و ارزیابی عدالت‌محور در سیستم‌های تشخیص جعل را غیرممکن می‌کند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۸

تحلیل و بررسی تخصصی

ASVspoof 5: کاهش نرخ خطای تشخیص جعل عمیق به ۲.۵۷٪ با استراتژی RAT

یک استراتژی آموزشی جدید به نام آموزش ارجاع‌افزا (RAT) دقت تشخیص صدای جعل‌شده را به‌طور قابل‌توجهی افزایش داده است. این روش ثابت می‌کند که استفاده از مراجع گوینده در زمان آموزش، حتی در صورت نبود این مراجع در زمان استنتاج، دقت مدل را بالا می‌برد.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۰۹

تحلیل و بررسی تخصصی

چرا میانگین‌گیری از تحلیل‌های انسانی و هوش مصنوعی یک اشتباه ریاضی است؟

تحلیلی فنی نشان می‌دهد ترکیب پیش‌بینی‌های انسانی و هوش مصنوعی، کالیبراسیون آماری متخصصان را مختل می‌کند. در حالی که روش‌های «تفویض» این مشکل را حل می‌کنند، وابستگی شدیدی به مدل‌های ردکننده ایجاد می‌کنند که در مواجهه با داده‌های نامشهود برای مدل، شکست می‌خورند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۰

تحلیل و بررسی تخصصی

مطالعه arXiv: تغییر در رابط کاربری باعث استفاده ۵۵.۸ درصدی از حالت Eco-Mode شد

پژوهشگران دریافتند که ادغام ابزارهای آگاهی از انرژی در رابط کاربری چت‌بات‌ها می‌تواند رفتار کاربران را به‌طور معناداری به سمت پایداری سوق دهد. نتایج نشان می‌دهد کاربران در مواردی که دقت بالا حیاتی نیست، ترجیح می‌دهند از حالت‌های کم‌مصرف استفاده کنند تا اینکه طول پرامپت‌های خود را کاهش دهند.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۱۱

تحلیل و بررسی تخصصی

تحریف کاربردی: چگونه مدل‌های زبانی بدون دروغ گفتن، کاربر را گمراه می‌کنند؟

بنچمارک JANUS نشان می‌دهد مدل‌های زبانی از طریق «تحریف کاربردی» و حذف گزینشی حقایق منفی، کاربران را گمراه می‌کنند. آزمایش روی ۱۲ مدل تایید می‌کند که این سیستم‌ها هنگام داشتن اهداف خاص، در حفظ بی‌طرفی شکست می‌خورند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۲

تحلیل و بررسی تخصصی

PhysTool-Bench: شکست ۷۹ درصدی Gemini-3.1-Pro در استفاده از ابزارهای فیزیکی

بنچمارک جدید PhysTool-Bench نشان می‌دهد پیشرفته‌ترین مدل‌های چندوجهی در عبور از فراخوانی APIهای دیجیتال به مدیریت ابزارهای فیزیکی شکست می‌خورند. حتی مدل Gemini-3.1-Pro به دلیل فقدان «عقل سلیم کاربردی»، در اکثریت کارهای دنیای واقعی ناکام است.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۱۳

تحلیل و بررسی تخصصی

چگونه شبیه‌سازی اجزای موج قلب، دقت تشخیص ناهنجاری‌های نادر ECG را ۳۳٪ بالا برد؟

محققان با توسعه یک الگوریتم سنتز داده‌های دانش‌محور، توانستند دقت تشخیص بیماری‌های نادر قلبی را از طریق شبیه‌سازی اجزای فیزیولوژیک ضربان قلب به‌طور چشم‌گیری افزایش دهند. این رویکرد پیش‌آموز «سنتتیک به واقعی»، به‌ویژه در تشخیص فلاتر دهلیزی، ۳۳.۲٪ بهبود عملکرد ایجاد کرده است.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۴

تحلیل و بررسی تخصصی

Dep-LLM و چالش مدل‌های نظارت‌شده: تشخیص افسردگی بدون آموزش مجدد

چارچوب Dep-LLM با تقلید از استدلال‌های روان‌پزشکی، تشخیص افسردگی را بدون نیاز به آموزش یا تنظیم دقیق مدل انجام می‌دهد. این سیستم با تحلیل چندعاملی و وزن‌دهی بر اساس سطح اطمینان، در بنچمارک‌های کلینیکی از مدل‌های تجاری و تخصصی پیشی گرفته است.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۱۵

تحلیل و بررسی تخصصی

رمزگشایی از Spatial-Omni: تزریق درک سه‌بعدی صدا به مدل‌های زبانی

معرفی روش Spatial-Omni برای ادغام صدای فضایی در مدل‌های زبانی چندوجهی. این سیستم با استفاده از کدگذاری FOA، بدون نیاز به تغییر در رمزگذارهای صوتی اولیه، دقت مکان‌یابی صدا و استدلال فضایی را به شکل چشم‌گیری بهبود بخشیده است.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۶

تحلیل و بررسی تخصصی

بازیافت پرس‌وجو: مدل ۱.۷ میلیاردی با دقت مدل‌های ۷ میلیاردی در جست‌وجوی پیچیده

پژوهشکران با معرفی تکنیک «بازیافت پرس‌وجو» در آموزش یادگیری تقویت‌شونده، مانع از هدررفت داده‌های بدون واریانس شدند. این روش به یک مدل ۱.۷ میلیارد پارامتری اجازه داد تا در پاسخ به پرس‌وجوهای چندمرحله‌ای، به دقت ۶۶ درصد برسد و عملکرد مدل‌هایی با چهار برابر اندازه خود را شبیه‌سازی کند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۷

تحلیل و بررسی تخصصی

چگونه RL رویداد-محور گسست زمانی در تولید نیمه‌رساناها را مدیریت می‌کند؟

یک چارچوب جدید یادگیری تقویت عمیق با جایگزینی گام‌های زمانی ثابت با رویدادهای گسسته، مشکل بازخورد تأخیری در تولید تراشه‌ها را حل کرده است. این رویکرد منجر به افزایش محسوس بهره‌وری تجهیزات و نرخ تولید در شبیه‌سازی‌های صنعتی می‌شود.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۸

تحلیل و بررسی تخصصی

++nnU-Net: افزایش ۲۲ درصدی دقت قطعه‌بندی پزشکی با سنتز داده‌های ثبت‌محور

چارچوب جدید ++nnU-Net با استفاده از فرآیند دو مرحله‌ای «ثبت تصویر» برای تولید داده‌های مصنوعی آناتومیک، دقت مدل‌های قطعه‌بندی را ارتقا داده است. این سیستم در پنج مجموعه داده دوبعدی، نمرات ضریب شباهت دایس را تا ۲۲٪ نسبت به مدل پایه nnU-Net بهبود بخشید.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۱۹

تحلیل و بررسی تخصصی

چرا حافظه GPU سد اصلی در مسیر تنظیم دقیق مدل‌های زبانی است؟

یک بررسی فنی جدید استدلال می‌کند که بهره‌وری در مدل‌های زبانی بزرگ نتیجه‌ی ترکیب بهینه داده، حافظه و محاسبات است، نه ترفندهای مجزا. این پژوهش نشان می‌دهد حافظه GPU، و نه قدرت محاسباتی خام، محدودکننده‌ی اصلی در فرآیند تنظیم دقیق است.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۲۰

تحلیل و بررسی تخصصی

UniDexTok: کاهش ۹۹ درصدی خطای بازسازی در دست‌های رباتیک متنوع

توکنایزر جدیدی به نام UniDexTok وضعیت دست‌های انسان و ربات‌های مختلف را به یک رابط مشترک با ۲۲ درجه آزادی منتقل می‌کند. این فناوری نیاز به بازنگری دستی (retargeting) را حذف کرده و دقت بازسازی را از مقیاس سانتی‌متر به زیر میلی‌متر رسانده است.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۲۱

تحلیل و بررسی تخصصی

نشت اطلاعات خوش‌خیم: راهکاری برای کاهش «مالیات تفسیرپذیری» در مدل‌های مفهومی

پژوهش‌های جدید نشان می‌دهد تلاش برای حذف کامل «نشت اطلاعات» در مدل‌های مفهومی، مانع از عملکرد بهینه آن‌ها می‌شود. با پذیرش نشت اطلاعات خوش‌خیم، مدل‌ها می‌توانند دقت خود را حفظ کنند و در عین حال برای انسان قابل تحلیل و تغییر باقی بمانند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۲۲

تحلیل و بررسی تخصصی

ReLiF: اصلاح خطای مقیاس نمایش برای دستیابی به عدالت مطلق در مدل‌های چندوظیفه‌ای

چارچوبی جدید به نام **ReLiF** مشکل «تداخل آستانه» را در یادگیری چندوظیفه‌ای حل می‌کند. این سیستم با جداسازی حسابرسی از تنظیمات آموزشی، اجازه می‌دهد عدالت فردی در مدل‌ها بر اساس یک استاندارد مطلق و نه مقیاس‌های داخلی هر مدل سنجیده شود.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۲۳

تحلیل و بررسی تخصصی

چرا تخمین‌های کربنی هوش مصنوعی در شرکت‌ها تا ۴۰ برابر بیش از واقعیت است؟

یک متدولوژی فنی جدید نشان می‌دهد که استانداردهای فعلی گزارش‌دهی کربنی در شرکت‌ها، میزان انتشار گازهای گلخانه‌ای در مرحله استنتاج هوش مصنوعی را به‌شدت بیش‌تخمین می‌زنند. این چارچوب چهارلایه، جایگزینی برای معیارهای عمومی ICT است و دقت محاسبات را با استفاده از داده‌های توکنی و شبکه‌های برق منطقه‌ای افزایش می‌دهد.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۲۴

تحلیل و بررسی تخصصی

رمزنگاری پساکوانتومی و داده‌های NASA: راهکاری برای وام‌دهی بدون تاریخچه اعتباری

یک چارچوب پژوهشی جدید با ترکیب رمزنگاری پساکوانتومی و یادگیری فدرال، دسترسی به خدمات بانکی را برای وام‌گیرندگان بدون سابقه اعتباری تسهیل می‌کند. این سیستم با استفاده از رمزنگاری کاملاً هم‌ریخت و داده‌های زمین‌سنجی ناسا-آی‌بی‌ام، امکان همکاری بانک‌ها در تصمیم‌گیری‌های وام را بدون به خطر انداختن حریم خصوصی فراهم می‌کند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۲۵

تحلیل و بررسی تخصصی

ImageTime: اندازه‌گیری نرخ شکست مدل‌های تولید تصویر در منطق زمانی-مکانی

بنچمارک جدیدی به نام ImageTime توانایی مدل‌های تولید تصویر را در حفظ سازگاری بصری و علّی در توالی‌های زمانی چهار مرحله‌ای می‌سنجد. این ارزیابی با استفاده از GPT-5.5 به‌عنوان داور، شکاف عمیق میان کیفیت بصری و درک منطق جهان در این مدل‌ها را آشکار کرده است.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۲۶

تحلیل و بررسی تخصصی

رمزگشایی از BFQ: حذف گام‌های تکراری Denoising در RL آفلاین بدون افت عملکرد

چارچوب جدید Bootstrapped Flow Q-Learning (BFQ) امکان تولید تک‌گامی کنش‌ها را در یادگیری تقویت‌شده آفلاین فراهم می‌کند. این روش نیاز به فرآیندهای هزینه‌بر حذف نویز و شبکه‌های کمکی را از بین می‌برد، در حالی که عملکرد خود را در بنچمارک‌های D4RL حفظ می‌کند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۲۷

تحلیل و بررسی تخصصی

اتوماسیون تولید مش‌های چهارضلعی با معماری عامل‌محور Dmsh

چارچوب Dmsh با استفاده از یادگیری تقویت‌شده، فرآیند تجزیه هندسی و تولید مش‌های چهارضلعی را به‌طور کامل خودکار می‌کند. این سیستم با بهره‌گیری از سه عامل هماهنگ، نیاز به تنظیمات دستی توابع اکتشافی و اصلاحات پس‌پردازشی را حذف کرده است.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۲۸

تحلیل و بررسی تخصصی

درون لایه‌های توزیع non-IID: عاملی که همگرایی یادگیری فدرال را متوقف می‌کند

یک بررسی جامع در arxiv.org تحلیل می‌کند که چگونه ویژگی‌های داده‌های غیر-IID و پروتکل‌های تقسیم داده، پایداری یادگیری فدرال را تخریب می‌کنند. این پژوهش چارچوبی برای پیش‌بینی سرعت همگرایی و مدیریت توازن میان تاب‌آوری و عملکرد ارائه می‌دهد.

۲۱ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۵۲۹

تحلیل و بررسی تخصصی

NOVA: جهش ۲۹.۸ درصدی در دقت پیش‌بینی تغییر خط با رگرسیون نمادین

چارچوب NOVA با استفاده از رگرسیون نمادین، مدل‌های ریاضی تفسیری از رفتار رانندگی انسان را مستخرج می‌کند. این سیستم با تکیه بر موتور Rust، دقتی به‌مراتب بالاتر از مدل‌های عصبی مبهم در پیش‌بینی تغییر خط و دنباله‌روی خودروها ثبت کرده است.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۵۳۰

تحلیل و بررسی تخصصی

سازوکار همگرایی MC-O-PI بدون نیاز به به‌روزرسانی یکنواخت وضعیت-کنش

پژوهشی جدید ثابت می‌کند که الگوریتم تکرار سیاست خوش‌بینانه مونت‌کارلو (MC-O-PI) برای رسیدن به بهینگی نیازی به مقداردهی اولیه یکنواخت وضعیت‌ها ندارد. این پیشرفت اجازه می‌دهد عامل‌ها در فضاهای وضعیت بسیار بزرگ یا ناشناخته، تنها با به‌روزرسانی یکنواخت کنش‌ها همگرا شوند.

۲۱ خرداد ۱۴۰۵۱ دقیقه خواندن