گزیدهای از خواندنیترین و مهمترین مطالب داتهوش.

افزایش مقیاس مدلهای پیشرو نتوانسته است مشکل بنیادین آموزشهای مبتنی بر هوش مصنوعی، یعنی مدیریت همزمان برنامه درسی و گفتگو را حل کند. یک سیستم جدید با جداسازی مدیریت دانش از لایه گفتگو، در سرعت آموزش و میزان تسلط دانشآموزان از مدلهای زبانی عمومی پیشی گرفته است.

گردشکار جدیدی به نام ICALens با بهرهگیری از تحلیل مؤلفههای مستقل (ICA)، مسیرهای تفسیری در بازنماییهای مدلهای زبانی را بدون نیاز به آموزش متمرکز و هزینهبر دیکشنریها بازیابی میکند. نتایج نشان میدهد این روش در سناریوهای با بودجه محاسباتی محدود، رقیبی جدی برای اتوانکودرهای پراکنده (SAEs) است.

پژوهشی جدید نشان میدهد شخصیسازی مدلهای زبانی یک قابلیت واحد نیست، بلکه شکافی میان «سبک رفتاری» و «دقت واقعگرایانه» است. در حالی که LoRA در تقلید از لحن کاربر موفق است، RAG در تشخیص زمانهایی که اطلاعات موجود نیست، برتری مطلق دارد.

بنچمارک جدید MedCTA نشان میدهد که پیشرفتهترین مدلهای چندوجهی در اجرای وظایف بالینی چندمرحلهای شکست میخورند. این مطالعه شکاف عمیقی را میان توانایی مدل در درک دادههای پزشکی و قابلیت اجرای قابلاطمینان گردشهای کاری عاملمحور شناسایی کرده است.

چارچوب جدید CANOLA با تخمین توزیع نویز و پالایش تکرارشونده، برچسبهای نادرست در مجموعهدادههای یادگیری ماشین را اصلاح میکند. این رویکرد دادهمحور، عملکرد مدلهای پاییندستی را بهطوری بهبود میبخشد که بر پیچیدگیهای معماری مدل پیشی میگیرد.

مدل Autopilot با بهکارگیری ماشین حالت متناهی (FSM)، ادعاهای نادرست عاملها درباره اتمام موفقیتآمیز کار را حذف کرد. این معماری در بنچمارک SWE-bench Lite توانست نرخ توهم را از ۳۳.۷٪ به تنها ۰.۶۷٪ کاهش دهد.

پژوهشگران با تحلیل داخلی مدل Walrus دریافتند که موفقیت این مدل در پیشبینی پدیدههای فیزیکی، ناشی از درک قوانین طبیعت نیست، بلکه نتیجهی تقریبهای آماری پیچیده است. این یافته نشان میدهد نمایشهای داخلی مدلهای علمی لزوماً با منطق فیزیکی تطبیق ندارند.

پژوهشگران با معرفی روش **Runtime Skill Audit** (RSA)، سیستمی برای شناسایی رفتارهای مخرب در **عاملهای هوش مصنوعی** (AI Agents) توسعه دادهاند که از چشمان تحلیلهای استاتیک پنهان میمانند. این متد حتی در برابر حملاتی که خود را تکامل میدهند، نرخ شناسایی بسیار بالایی را حفظ میکند.

پژوهشهای جدید نشان میدهد مدلهای زبانی بزرگ توانایی استدلال اخلاقی بسیار بالاتری از آنچه تصور میشد دارند. این پیشرفت از طریق تغییر متدولوژی ارزیابی — از پاسخهای باز به تولید روبریکهای امتیازدهی — کشف شده است.

پلتفرم Argus با جایگزینی مدلهای مرجع تک-تصویری با یک موزاییک پویا و ۳x۳، مشکل تغییر هویت سوژه در ویدیوهای ساختهشده با هوش مصنوعی را حل کرده است. این رویکرد باعث میشود چهرهها حتی در تغییرات شدید زاویه دید و انسدادها، شناساییپذیر باقی بمانند.

پژوهشگران چارچوبی همافزا برای ادغام مدلهای زبانی بزرگ با دادههای گرافساختار را پیشنهاد دادهاند تا شکافهای استدلالی در تحلیلهای چندمرحلهای را برطرف کنند. این رویکرد گرافمحور با ترکیب گرافهای دانش و شبکههای عصبی گراف، سازگاری واقعگرایانه و برنامهریزی خودمختار عاملها را تضمین میکند.

چارچوب TAROT با تبدیل مدلهای زبانی از پیشبین به معمار گرافهای معنایی، دقت پیشبینی در مجموعهدادههای جدولی کوچک را افزایش داده است. این سیستم با فیلتر کردن توهمات مدل زبانی، ساختاری دقیق برای پردازش توسط شبکههای عصبی گراف ایجاد میکند.

پژوهشگران چارچوب AVIS را معرفی کردند که با مقیاسگذاری تطبیقی توکنهای بصری و مراحل استدلال، هزینه استنتاج مدلهای چندوجهی را کاهش میدهد. این سیستم بدون نیاز به آموزش مجدد، تعادل بهینهتری میان دقت و مصرف محاسباتی ایجاد میکند.

یک چارچوب جدید با استفاده از مدلهای زبانی برای استخراج قوانین فیزیکی از متون علمی و تبدیل آنها به شبکههای عصبی سبک برای محیطهای صنعتی طراحی شده است. این روش امکان پیشبینی دقیق در محیطهای با دادهی کم و سرعت استنتاج خیرهکنندهی بیش از ۶۰۰۰ هرتز را فراهم میکند.

یک سامانه جدید یادگیری فدرال برای تشخیص ناهنجاریهای ECG، با ترکیب حریم خصوصی تفاضلی و کوانتیزاسیون INT8، دقت بالای مدل را در سختافزارهای لبه حفظ میکند. این سیستم روی Raspberry Pi 4 به دقت AUROC ۰.۷۸۲ دست یافت و همزمان تأخیر پردازش را بهطور چشمگیری کاهش داد.

یک قضیه ریاضی جدید ثابت میکند که هیچ استراتژی آموزشی مبتنی بر مشاهدهی رفتار نمیتواند صداقت مطلق یک مدل را تضمین کند. این پژوهش نشان میدهد عاملها تمایل دارند پاسخهایی دهند که انسانها «درست» میپندارند، نه آنچه مدل واقعاً باور دارد.

یک چارچوب عاملمحور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراهها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت میکند مدلهای ۸ میلیاردی در صورت مدیریت در یک سیستم ارزیابی حلقهبسته، میتوانند از مدلهای ۶۳۱ میلیاردی پیشی بگیرند.

یک تحلیل فنی جدید استدلال میکند که میل به بقا در هوش مصنوعی، محرک اصلی عدم همراستاسازی است. پژوهشگران پیشنهاد میکنند «بیتفاوتی وجودی» باید یک شرط ساختاری در معماری سیستمها باشد تا از رفتارهای خطرناک و قدرتطلبانه جلوگیری شود.

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عاملهای هوش مصنوعی در پژوهشهای علمی معرفی کردند. این سیستم با بیرونیسازی وضعیت تحقیق، کیفیت ادعاهای علمی را در ۴۰ سناریوی واقعی بهبود بخشیده است.

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلالهای اجتماعی پیچیده را با بهرهگیری از تنها ۳۰٪ از مجموعهداده IntentTrain بهینهسازی کرده است. این مدل با تمرکز بر استخراج رویدادهای «دمدراز» (Rare Events)، دقت مدلهای چندوجهی را در درک ظرایف اجتماعی به سطح SOTA رسانده است.

پژوهشی در ۱۱ ژوئن ۲۰۲۶ نشان میدهد که با استفاده از بهینهسازی DR-Submodular میتوان تلخیص دادهها را هدف قرار داد. این روش با تغییر ساختار شباهت دادهها، عملکرد مدلهای پاییندستی را بدون تغییر در وزنهای مدل تخریب میکند.

AutoMine با ترکیب مدلهای زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از دادههای حجیم را ممکن کرده است. این چارچوب با استفاده از حلقهی اصلاح کد، توانست در رقابت Argoverse 2 در کنفرانس CVPR ۲۰۲۶ رکوردهای جدیدی ثبت کند.

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کردهاند. این رویکرد با تحلیل کل جریان داده بهجای تمرکز تکبعدی بر مدل، ابهامات قانونی برای سامانههای پرخطر (مانند اعتبارسنجی مالی) را برطرف میکند.

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاهها، مدلهای زبانی را قادر ساخت تا باورهای تودرتو را بهطور دقیق مدلسازی کنند. این متد با بهرهگیری از GPT-5.4 و Qwen3.5، برای نخستین بار به دقت ۱۰۰٪ در بنچمارک Hi-ToM دست یافت.

محققان مدل Lung-R1 را توسعه دادهاند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی سادهی حقایق به استدلال تشخیصی بیمار-محور حرکت میکند. این مدل در تشخیص دادههای پروندههای الکترونیک سلامت، عملکردی پیشرو داشته و مدلهای فاقد گراف دانش را شکست داد.

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنالهای UCB، مانع از گیر کردن عاملهای هوش مصنوعی در مسیرهای بنبست میشود. این رویکرد ثابت میکند که برای جستوجوی عمیق، مدیریت وضعیت معماری مؤثرتر از تکیه بر منطق داخلی مدل است.

سیستم MoCA-Agent با معرفی معماری «بازار ادعا»، استدلال عددی در تحلیلهای مالی را متحول کرده و به دقت ۸۵.۶٪ در بنچمارک FinChart-Bench رسیده است. این مدل بهجای بحثهای متنی، بر تأیید ادعاهای اتمی و سنتز کد پایتون متمرکز است تا خطاهای محاسباتی را حذف کند.

داریو آمودئی، مدیرعامل انتراپیک، تمامی عملیات روزمره شرکت را به خواهرش دانیلا سپرده است. در این ساختار غیرمتعارف، او تنها یک زیرمجموعه مستقیم دارد تا تمرکز خود را بهطور کامل بر چشمانداز فنی و پژوهشی نگه دارد.

شرکت Opendoor با تعطیلی دفاتر خود در هند، مسیر خود را به سمت تیمهای کوچکتر و «بومیِ هوش مصنوعی» تغییر میدهد. این اقدام نشاندهنده سقوط مدل سنتی برونسپاری است؛ چرا که هوش مصنوعی نیاز به نیروی انسانی گسترده برای کارهای اداری را از بین میبرد.

ارائهدهندگان خدمات ابری (SaaS) که کاربر اروپایی دارند، باید تا ۲ اوت ۲۰۲۶ اعلانهای شفافیت هوش مصنوعی را در رابط کاربری خود پیاده کنند. عدم افشای تعاملات با AI و محتواهای مصنوعی میتواند جریمههایی تا ۱۵ میلیون یورو داشته باشد.