تازه‌ترین اخبار

چرا متد گرم‌بندی در مدل‌های بینایی-زبانی اثر نهایی RL را تغییر نمی‌دهد؟

یک مطالعه فنی روی مدل‌های بینایی-زبانی نشان می‌دهد که انتخاب بین SFT و OPD در مرحله گرم‌بندی، تنها بر رژیم آنتروپی اولیه اثر می‌گذارد و تأثیری بر عملکرد نهایی یادگیری تقویت‌شده ندارد. این یافته‌ها ریسک بیش‌برازش در تنظیم دقیق نظارت‌شده را به عنوان تهدیدی جدی برای تعمیم‌پذیری مدل‌ها برجسته می‌کند.

چرا متد گرم‌بندی در مدل‌های بینایی-زبانی اثر نهایی RL را تغییر نمی‌دهد؟

BareWave: حذف نمایش‌های آکوستیکی برای تولید مستقیم موج صوتی از متن

چگونه SafeRun با تفکیک استنتاج و نظارت به ایمنی ۱۰۰ درصدی رسید؟

TRIAGE: کاهش ۸۱ درصدی خطای کالیبراسیون در تشخیص ریسک‌های پزشکی

سنجش مدل‌های جهانی در ثانیه‌ها: سازوکار ATM برای حذف شبیه‌سازی‌های زمان‌بر

چگونه TLDR با فشرده‌سازی وصله‌ای، گلوگاه حافظه در مدل‌های TTS را می‌شکند؟

رمزگشایی از «حوضه‌های کم‌تلفات»: دلیل برتری QAT بر PTQ در مدل‌های فشرده

«حلقهٔ هکر-اصلاح‌گر»: متدی برای حذف تقلب در بنچمارک‌های عامل‌محور

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

PACT: عبور از بن‌بست تداخل استدلالی در مدل‌های پزشکی با اجماع شاخه‌ای

چرا دقت در بازیابی متون دیگر معیار موفقیت در جستجوهای علمی نیست؟

PAI: بازیابی اطلاعات دامنه و دستیابی به بهبود ۹۸.۴ درصدی در تشخیص ناهنجاری

چرا بازیابی دقیق متون در RAG برای رعایت قوانین حقوقی کافی نیست؟

چرا تنظیم دقیق تک‌مرحله‌ای برای بازرسی تراشه‌ها کافی نیست؟

سازوکار BODHI: افزایش ۲.۳ برابری تفکیک مفاهیم در مدل‌های رفتاری زیست‌پزشکی

چرا مدل‌های یکپارچه در MRI شکست می‌خورند و SpineAgent به ۳۷ عامل نیاز دارد؟

کاهش ۳۶ برابری زمان تنظیم شبیه‌سازهای علمی با لایه‌های مبنی‌سازی SIGA

چگونه پروتکل CHAP تعاملات انسان و عامل را به مدرک قابل حسابرسی تبدیل می‌کند؟

گزارش arXiv: بازگشت ۲۴ درصدی خطاهای اصلاح‌شده در خروجی‌های عامل‌های پژوهشی

SearchSwarm-30B: دستیابی به امتیاز ۷۳.۳ در BrowseComp-ZH با هوش تفویض‌محور

سازوکار PRIME: شناسایی نشانه‌های پنهان تقلب در پاداش پیش از وقوع شکست

CFips: عبور از بن‌بست محاسباتی در استخراج الگوهای بازه‌ای

چرا طراحی بازگشتی در DGM باعث جهش ۲.۵ برابری عملکرد در بنچمارک SWE-bench شد؟

۸۶٪ دقت در تأیید پروتکل‌های درمانی سکته مغزی با ارکستراسیون مدل‌های زبانی

گزارش ArXiv: کاهش ۲۸ درصدی توکن‌های استنتاج از طریق استدلال بصری

چرا «خودتوضیحی» در هوش مصنوعی هنوز در سطح مفاهیم باقی مانده است؟

چگونه PRISM دستورات پنهان عامل‌های هوش مصنوعی را از دل فعال‌سازها بیرون می‌کشد؟

گزارش ArXiv: برتری داده‌های اختصاصی بر ساختارهای استدلالی در ارزش‌گذاری دارویی

MedSci Skills: شناسایی ۱۰۰٪ خطاهای پزشکی با جایگزینی LLM با گیت‌های قطعی

بهینه‌سازی پایش آنفلوانزا از طریق استنتاج گزینشی متغیرهای پنهان (BSLI)