پرخواننده‌ترین‌ها

چرا «خودتوضیحی» در هوش مصنوعی هنوز در سطح مفاهیم باقی مانده است؟

یک بررسی جامع در arXiv نشان می‌دهد که مفهوم «خودتوضیحی» (SX) در سیستم‌های هوش مصنوعی، علیرغم اهمیت بنیادین، هنوز فاقد پیاده‌سازی عملی و معیارهای ارزیابی استاندارد است. این پژوهش شکاف عمیق میان تئوری‌های موجود و واقعیت‌های مهندسی را افشا می‌کند.

چرا «خودتوضیحی» در هوش مصنوعی هنوز در سطح مفاهیم باقی مانده است؟

چگونه PRISM دستورات پنهان عامل‌های هوش مصنوعی را از دل فعال‌سازها بیرون می‌کشد؟

گزارش ArXiv: برتری داده‌های اختصاصی بر ساختارهای استدلالی در ارزش‌گذاری دارویی

MedSci Skills: شناسایی ۱۰۰٪ خطاهای پزشکی با جایگزینی LLM با گیت‌های قطعی

بهینه‌سازی پایش آنفلوانزا از طریق استنتاج گزینشی متغیرهای پنهان (BSLI)

مدل انتخاب پرسونا: چگونه آموزش ایمنی محدود، همراستاسازی جامع را تحریک می‌کند؟

TheoremBench: افشای سوگیری مدل‌های زبانی در حل زیر-براهین ساده ریاضی

AliyunConsoleAgent: دستیابی به عملکرد مدل‌های پیشرو با ۹۲٪ هزینه کمتر

چگونه SIFT با جایگزینی تنسورهای KV سرعت پیش‌تولید RAG را ۱.۷۱ برابر کرد؟

رمزگشایی از «قرارداد شناختی» در SuperBrowser: عبور از بن‌بست پردازش DOM در وب

چرا عامل‌های هوش مصنوعی در مدیریت هم‌زمان محیط‌های گرافیکی و متنی شکست می‌خورند؟

«مالیات استدلال»: کاهش ۲۸ درصدی دقت مدل‌های متوسط در خروجی‌های JSON

ArXiv: همبستگی ۰.۹ بین رتبه‌بندی Elo و دقت واقعی مدل‌ها

«STRP»: بازسازی تفصیلی داده‌های ترافیکی با استفاده از کانولوشن اتساعی معکوس

حل شکاف میان برنامه‌ریز و اجراکننده در LLMها با رویکرد بهینه‌سازی مشترک CAHL

PCI: کاهش ۴۰ درصدی زمان استنتاج در مسئله فروشنده دوره‌گرد با حذف جستجوی گرادیان

چرا جست‌وجوی یک مدل جامع برای داده‌های جدولی به بن‌بست می‌رسد؟

تحلیل ۱۲ هزار نوبت تعامل: افشای سوگیری تولید در مدل‌های چندوجهی یکپارچه

Graph2Idea: ارتقای نرخ نوآوری ایده‌های علمی از ۰.۴۵ به ۰.۵۲ با گراف‌های دانش

توقف فروپاشی مدل‌های جهان با مکانیسم زیرهدف‌های سلسله‌مراتبی در FF-JEPA

افزایش ۱۷.۱۹ درصدی بینش تجربی در پژوهش‌های علوم اجتماعی با چارچوب MASS

VisShield و گذار از تاری تصاویر به حذف هدفمند داده‌های حساس در مدل‌های بینایی

ترکیب AI و FEA در سیستم‌های چندعاملی برای حذف گلوگاه‌های محاسباتی طراحی موتور

RePO: جایگزینی بیشینه‌سازی پاداش با کمینه‌سازی حسرت در همراستاسازی LLM‌ها

چرا ترکیب زنجیره تفکر و MCTS در مهندسی ویژگی‌های جدولی بهین‌ترین بازدهی را دارد؟

فراتر از داوران LLM: مکانیسم «مداخلاتی» برای ردیابی خطاهای خاموش در عامل‌ها

چگونه چارچوب «اقتصاد عامل‌ها» از یکسان‌سازی تفکر در مدل‌های زبانی جلوگیری می‌کند

کالبدشکافی ناپایداری در عامل‌های AI: از نمونه‌برداری توکن تا نویز زیرساختی

«امنیت رابطه‌ای»: شکافی در ارزیابی‌های فعلی که شخصی‌سازی LLMها ایجاد می‌کند

تغییر رویکرد از «دوربین» به «نقشه» در AlloSpatial؛ ارتقای ۱۸ درصدی استدلال مکانی