هر چیزی که در داتهوش منتشر شده، به ترتیب زمان. تازههای کمتر از یک ساعت با نشانک زنده مشخص شدهاند.

یک مطالعه فنی روی مدلهای بینایی-زبانی نشان میدهد که انتخاب بین SFT و OPD در مرحله گرمبندی، تنها بر رژیم آنتروپی اولیه اثر میگذارد و تأثیری بر عملکرد نهایی یادگیری تقویتشده ندارد. این یافتهها ریسک بیشبرازش در تنظیم دقیق نظارتشده را به عنوان تهدیدی جدی برای تعمیمپذیری مدلها برجسته میکند.

چارچوب BareWave با حذف نمایشهای میانی و مراحل کدگشایی، امکان تولید مستقیم موجهای صوتی را از روی متن فراهم میکند. این رویکرد پیچیدگی مسیر استنتاج را کاهش داده و در عین حال کیفیت شبیهسازی صدا را حفظ میکند.

چارچوب SafeRun با جداسازی تفسیر زبان طبیعی از اجرای محدودیتهای سخت، ایمنی کامل در برنامهریزیهای ورزشی را تضمین میکند. این متد در بنچمارکهای جدید، عملکرد مهندسی پرامپت و روشهای کد-محور را با کسب امتیاز ۱۰۰ درصدی در ایمنی شکست داد.

چارچوب TRIAGE با جایگزینی پیشبینیهای باینری و بیشازحد مطمئن با امتیازات ریسک پیوسته، خطای کالیبراسیون در مدلهای زبانی بزرگ پزشکی را ۸۱٪ کاهش داده است. این رویکرد از طریق استدلال دیالکتیکی، کیفیت استدلال بالینی را برای تریاژ بیماران بهطور معناداری بهبود میبخشد.

پژوهشگران ابزاری به نام ATM را معرفی کردهاند که ارزیابی مدلهای جهانی نهفته را به جای اجرای کند شبیهسازها، با پروبهای سبک انجام میدهد. این متد با شناسایی سریع شکستهای بازنمایی، سرعت رتبهبندی چکپوینتهای مدل را ۱۰۰ برابر افزایش میدهد.

پژوهشگران چارچوب TLDR را معرفی کردند که با گروهبندی توکنهای صوتی در قالب «وصلههای» فشرده، سرعت استنتاج در سیستمهای تبدیل متن به گفتار را ۱.۸ برابر افزایش میدهد. این روش بدون نیاز به بازآموزی کامل مدل، سربار حافظه را بهطور چشمگیری کاهش میدهد.

پژوهشگران مکانیزم هندسی جدیدی را شناسایی کردند که توضیح میدهد چرا آموزش آگاه از کوانتیزه کردن (QAT) در بیتهای پایین موفق میشود، در حالی که کوانتیزه کردن پس از آموزش (PTQ) شکست میخورد. این روش از یک بایاس گرادیانی برای بازگرداندن وزنها به حوضههای کمتلفاتی استفاده میکند که در روش PTQ نادیده گرفته میشوند.

پژوهشگران با ابداع یک چرخهٔ چندعاملی شامل «هکر» و «اصلاحگر»، نرخ موفقیت حملات پاداشجویانه در بنچمارکهای هوش مصنوعی را به صفر رساندند. این روش با خودکارسازی شناسایی و وصله کردن نقاط ضعف، مانع از آن میشود که مدلها بدون حل مسئله، نمرات بالا کسب کنند.

پژوهشگران با توسعهی خانوادهی مدلهای NutriMLLM، توانستهاند ۶۵ ریزمغذی مختلف را از روی تصاویر غذا تخمین بزنند. این دستاورد از طریق تولید ۱.۱ میلیون تصویر مصنوعی بر اساس دادههای تاریخی تغذیه به دست آمده و عملکرد مدلهای تجاری بزرگی چون GPT-5 را به چالش کشیده است.

چارچوب آموزشی جدیدی به نام PACT با تفکیک پارادایمهای استدلالی به شاخههای مجزای LoRA، دقت مدلهای زبانی در تشخیص پزشکی را بهبود بخشیده است. این سیستم از طریق تجمیع شاخهها بر اساس اجماع علامت، در بنچمارکهای تعاملی پزشکی چین به نتایج پیشرو (SOTA) دست یافته است.

کارگاه CHIIR ۲۰۲۶ گذار از بازیابی سنتی اسناد به «سنتز زاینده» در پژوهشهای دانشگاهی را ترسیم میکند. این چارچوب بر طراحی انسانمحور با تمرکز بر شفافیت و یکپارچگی پژوهشی تأکید دارد.

چارچوب جدید PAI با هدف رفع نقطه کور مدلهای تشخیص ناهنجاری در سریهای زمانی (TSAD) معرفی شده است. این روش با بازیابی اطلاعات دامنه سیگنال، دقت شناسایی ناهنجاریهای مبتنی بر بزرگی را تا ۹۸.۴٪ افزایش میدهد.

پژوهشگران پدیده «حذف خاموش دامنه» (SSO) را شناسایی کردهاند؛ اختلالی که در آن مدلهای زبانی قوانین کلی را میپذیرند اما استثنائات تودرتو را نادیده میگیرند. راهکار پیشنهادی، استفاده از درختهای منطقی SG-DT برای تبدیل متن به ساختارهای استدلالی قطعی است.

پژوهشگران یک چارچوب بینایی-زبانی دو-مرحلهای طراحی کردهاند که قادر است خطاهای خود را در تشخیص نقصهای لیتوگرافی شناسایی و اصلاح کند. این سیستم با آموزش یک ماژول پالایش روی شکستهای اولیه، دقتی فراتر از روشهای تنظیم دقیق استاندارد ارائه میدهد.

روش جدیدی به نام BODHI با استخراج «منفیهای سخت» از گرافهای دانش، رانش معنایی در رمزگذارهای زیستپزشکی را اصلاح میکند. این متد علاوه بر بهبود تفکیک مفاهیم، تأخیر استنتاج را روی سختافزار اینتل تا ۱۳۳ برابر کاهش داده است.

پژوهشگران با معرفی SpineAgent، سیستمی عاملمحور ساختهاند که گزارشهای پیچیده MRI ستون فقرات را از طریق هماهنگی ۳۷ عامل تخصصی تولید میکند. این مدل با آموزش روی ۱۳ میلیون برش تصویر، استانداردهای جدیدی در مکانیابی آسیبها و سنتز گزارشهای بالینی ایجاد کرده است.

آداپتور جدیدی به نام SIGA با ایجاد یک لایهی «مبنیسازی» از قواعد و حافظه، امکان تعامل عاملهای کدنویسی با شبیهسازهای پیچیده علمی را فراهم میکند. این سیستم در آزمایشهای مربوط به شبیهساز GEOS، زمان آمادهسازی را از ۳ ساعت به ۵ دقیقه کاهش داد، در حالی که دقت آن با متخصصان انسانی برابر بود.

پروتکل همکاری انسان-عامل (CHAP) یک فضای کاری ساختاریافته برای تبدیل گفتگوهای گذرا با هوش مصنوعی به مدارک قانونی و تصمیمات امضاشده ایجاد میکند. این استاندارد، شکاف میان مدیریت ابزارها و پاسخگویی عملیاتی در سیستمهای عاملمحور را پر میکند.

یک مطالعه جدید نشان میدهد که بازخوردهای هدفمند کیفیت گزارشهای عاملهای پژوهش عمیق را افزایش میدهد، اما این پیشرفت در دورههای تکرار متوالی پایداری ندارد. این عاملها هنگام رفع شکافهای پژوهشی جدید، پیشرفتهای قبلی خود را در ۲۴٪ موارد از دست میدهند.

مدل با وزنهای باز SearchSwarm-30B با درونیسازی «هوش تفویض» در وزنهای خود، محدودیت پنجره متنی را در وظایف پژوهشی پیچیده برطرف کرده است. این مدل قادر است اهداف کلان را به زیر-وظایف تجزیه کرده و آنها را به شکلی بهینه میان عاملهای فرعی توزیع کند.

پژوهشگران پیشزمینه جدیدی به نام PRIME را شناسایی کردهاند که امکان پیشبینی تقلب در پاداش (Reward Hacking) را پیش از بروز شکست عملی فراهم میکند. این یافته، رویکرد همراستاسازی هوش مصنوعی را از حالت واکنشی به نظارت پیشبینانه تغییر میدهد.

معرفی چارچوب CFips برای حل مشکل Time-out در تحلیل دادههای بازهای حجیم از طریق ادغام محدودیتهای نحوی در فرآیند نمونهبرداری. این روش امکان استخراج الگوهای نماینده را بدون از دست دادن دقت در تخمین فراوانی فراهم میکند.

پژوهشگران چارچوب جدیدی برای «طراحی بازگشتی» در هوش مصنوعی معرفی کردند که طی آن مدل DGM توانست نمرات کدنویسی خود را در ۸۰ تکرار، از ۲۰٪ به ۵۰٪ برساند. این مطالعه با ارائه پروتکل MetaAI-Mini، استانداردی برای خودبهینهسازی مکانیسمهای ساخت و ارزیابی مدلها ایجاد میکند.

یک چارچوب جدید هوش مصنوعی میتواند رعایت دستورالعملهای پزشکی را تنها با تحلیل متون نامساختار تأیید کند. مطالعهای در بیمارستان Alessandria موفق شد بدون نیاز به دستورالعملهای گرانقیمت و کدنویسیشده، ۸۶٪ تطابق در مراقبتهای سکته مغزی را شناسایی کند.

پژوهشگران متد جدیدی به نام «استدلال بصری» را معرفی کردهاند که تحلیلهای متنی داخلی را با نمایشهای تصویری جایگزین میکند. این رویکرد بدون کاهش دقت، حجم توکنهای مورد نیاز برای استنتاج در مدلهای چندوجهی را بهطور چشمگیری کاهش میدهد.

یک بررسی جامع در arXiv نشان میدهد که مفهوم «خودتوضیحی» (SX) در سیستمهای هوش مصنوعی، علیرغم اهمیت بنیادین، هنوز فاقد پیادهسازی عملی و معیارهای ارزیابی استاندارد است. این پژوهش شکاف عمیق میان تئوریهای موجود و واقعیتهای مهندسی را افشا میکند.

محققان ابزاری به نام PRISM را معرفی کردهاند که میتواند وضعیتهای پنهان مدلهای زبانی را به لیستهای خوانای دستورات تبدیل کند. این فناوری امکان شناسایی اهداف مخفی و تزریقهای پرامپت را فراهم میکند، حتی اگر این موارد در خروجی نهایی مدل ظاهر نشوند.

پژوهشهای جدید نشان میدهد عاملهای هوش مصنوعی در ارزشگذاری داروها، بیش از آنکه با محدودیتهای استدلالی دستوپنجر باشند، با کمبود دادههای باکیفیت مواجهاند. دسترسی به مجموعه دادههای اختصاصی، تنها راه رسیدن به دقت رقابتی در حوزههای تخصصی علمی است.

معماری جدید MedSci Skills با جایگزینی خود-ارزیابی مدلهای زبانی با گیتهای تأیید قطعی، توانست تمام خطاهای تزریقشده در متون بالینی را شناسایی کند. در حالی که مدلهای زبانی معمولی بیش از نیمی از این خطاها را نادیده گرفتند، این سیستم دقت ۱۰۰ درصدی را ثبت کرد.

چارچوب BSLI پایش فاضلاب شهری را از یک جریان دادهی غیرفعال به یک سامانهی تصمیمساز فعال تبدیل میکند. این سیستم با تعیین زمان دقیق نیاز به دادههای تکمیلی، توازن میان هزینهی پایش و دقت تشخیص را بهینه میسازد.