هر چیزی که در داتهوش منتشر شده، به ترتیب زمان. تازههای کمتر از یک ساعت با نشانک زنده مشخص شدهاند.

پژوهشگران با معرفی چارچوب Tensor-Coord، برنامهریزی در سیستمهای چندعاملی را از مذاکرات شکننده بر پایه پرامپت به همراستاسازی ریاضی منتقل کردند. این روش با استفاده از تجزیه جبری تنسورها، تداخل در اجرای برنامهها را بهصورت قطعی حذف میکند.

چارچوب MGIL با استفاده از خوشهبندی موجودیتها، یک «گراف مدل» ایجاد میکند تا الگوهای ساختاری سراسری را شناسایی کند. این رویکرد در پیشبینی استقرایی پیوندها (Inductive Link Prediction) به نتایجی در سطح پیشرو (SOTA) رسیده است.

پژوهشگران چارچوبی به نام EC-Script توسعه دادهاند که به مدلهای زبانی اجازه میدهد روایتهای داستانی را با مسیرهای احساسی دقیق، مخصوص هنردرمانی، تولید کنند. این سیستم از یک ساختار عاملمحور سلسلهمراتبی استفاده میکند تا اطمینان حاصل شود که روایتها دقیقاً از الگوهای عاطفی مورد نیاز برای بهبودی روانشناختی پیروی میکنند.

پژوهشگران چارچوب جدیدی برای quantifying و بیمه کردن ریسکهای مالی عاملهای خودمختار معرفی کردهاند. این سیستم با جایگزینی قضاوت مدلهای زبانی با برچسبهای اقتصادی قطعی، نرخ خطای قیمتگذاری ریسک را به شدت کاهش داده است.

تحقیقات جدید نشان میدهد عاملهای هوش مصنوعی اغلب ابزار درست را شناسایی میکنند اما در مرحله نهایی تصمیمگیری دچار خطا میشوند. این یافته، اثربخشی روشهای رایج مهندسی پرامپت برای حل این مشکل را زیر سؤال میبرد.

هوش مصنوعی پر است از ابزارهای رایگان، اما برای کاربر ایرانی پرسشِ اصلی این نیست که کدام بهتر است؛ این است که کدام واقعاً از داخل باز میشود و کدام برای ثبتنام یا ارتقا به شماره و کارت خارجی گره خورده است. این راهنمای کامل، ابزارهای رایگانِ گفتگو و جستوجوی هوشمند، تولید و ویرایش تصویر، نوشتن و خلاصهسازی، تبدیل گفتار به متن، ساخت صدا و موسیقی، ویدیو و کدنویسی را دستهبندی میکند و برای هرکدام وضعیت دسترسی از ایران را صریح میگوید — با یک نتیجهٔ روشن: ابزارهای متنباز و قابلنصب روی سیستم خودتان، بیدردسرترین و پایدارترین انتخاب برای کاربر ایرانیاند.

یک چارچوب جدید به سیاستهای RMAPPO اجازه میدهد در لحظهی اجرا از قوانین خارجی یا راهنماییهای مدلهای زبانی استفاده کنند تا سرعت بازیابی خطوط تولید پس از نقص فنی افزایش یابد. این روش زمان بازیابی را بدون نیاز به بازطراحی یا بازآموزی عامل هوش مصنوعی کاهش میدهد.

یک ممیزی روی ۱۲ مدل هوش مصنوعی نشان میدهد که جایگاه یک هتل در لیست دادهها، بهطور مستقل بر توصیهی مدل اثر میگذارد. این سوگیری ساختاری باعث میشود ارزش ادراکی هر اتاق شبانه حدود ۱۲ دلار تغییر کند، در حالی که پاسخهای مدیریت هتل تقریباً بهطور کامل نادیده گرفته میشوند.

متد MHL وزنهای مبهم شبکههای عصبی را با قوانین قطعی پایتونی جایگزین میکند. این چارچوب دقت بالای استانداردهای فعلی را در دادههای پزشکی حفظ کرده و در عین حال قابلیت بازبینی کامل توسط پزشکان را فراهم میسازد.

چارچوب AdaSTORM با استفاده از تقسیمبندی تطبیقی و معماری چند-عاملی، محدودیت مقیاسپذیری در استدلال گرافهای پویا را شکست. این سیستم بدون نیاز به ابزارهای خارجی، به دقت بیش از ۹۰ درصد در گرافهای هزار-گرهای دست یافته است.

یک چارچوب معماری جدید پیشنهاد میدهد که «خرد» را از «هوش» جدا کند تا از بهینهسازی کورکورانه اهداف مضر جلوگیری شود. این سیستم از طریق یک لایه حاکمیتی و یک توپل ششمؤلفهای، پیش از اجرا، اهداف را مورد پرسش قرار میدهد.

پلتفرم StateGen با معرفی یک مدیریت وضعیت متمرکز و ساختار چهار-نقش، توهمات مربوط به نتایج ابزارها در عاملهای هوش مصنوعی را حذف کرده است. این معماری با تولید دادههای مصنوعی دقیق، به نمره ۹.۶۶ از ۱۰ در ارزیابی بیش از ۶۴ هزار گفتگو دست یافت.

رویکرد Latent Thought Flow با جایگزینی توکنهای متنی در زنجیره تفکر با مسیرهای پیوسته در فضای پنهان، دقت پاسخدهی را ۹.۵٪ افزایش داده است. این متدولوژی هزینه محاسباتی استنتاج را بهطور چشمگیری کاهش میدهد.

پژوهشگران با معرفی PAL-Bench نشان دادند که مدلهای هوش مصنوعی علیرغم توانایی در خلاصهسازی، در پیوند دادن هویتهای تکرارشونده در دادههای بلندمدت ناتواناند. این شکاف، تفاوت بنیادین میان «خلاصهسازی محتمل» و «بازسازی دقیق» هویتهای اجتماعی را آشکار میکند.

پژوهشگران چارچوب OQ-TSAE را معرفی کردهاند تا نمایشهای هوش مصنوعی را راستیآزمایی کنند تا تنها تمایزات موردپشتی سختافزاری را حفظ کنند. این سیستم با استفاده از «خارجقسمتهای مشاهده»، نویزهای مزاحم را حذف کرده و دقت مدل در بازنمایی واقعیت را نسبت به روشهای سنتی افزایش میدهد.

یک تحلیل تشخیصی جدید نشان میدهد توانایی یک مدل زبانی در حل مسائل پیچیده، تضمینکننده اثرگذاری آن در تدریس نیست. محققان با استفاده از MathTutorBench دریافتند که معیارهای «حل مسئله» و «پداگوژی» تنها همپوشانی جزئی دارند و برترین حلکنندهها لزوماً بهترین معلمان نیستند.

پژوهشگران چارچوب TimeVista را معرفی کردهاند که با بهرهگیری از مدلهای بینایی-زبانی (VLMs)، پیشبینیهای سریهای زمانی را از طریق تحلیل نمودارها ارزیابی میکند. این رویکرد در مقایسه با معیارهای سنتی عددی، همراستایی بهمراتب بیشتری با ترجیحات بصری انسان دارد.

تلاشهای فعلی برای ایجاد هوش مصنوعی کثرتگرا اغلب تنوع را به جایگزینهای آماری تقلیل میدهند و ساختارهای معنایی بنیادین را نادیده میگیرند. چهارچوب جدید PLG تلاش میکند با حسابرسی کیفی، مانع از «تسطیح» مفاهیم انسانی پیچیده در مدلها شود.

چارچوب استدلالی سبکوزن LiteOdyssey با تکیه بر سیاستهای همکاری انسان-ماشین، در تشخیص بیماریهای بسیار نادر از GPT-5.4 پیشی گرفت. این دستاورد نشان میدهد که ساختار استدلالی دقیق بر مقیاسبندی خشن دادهها برتری دارد.

VibeThinker-3B مدلی با ۳ میلیارد پارامتر است که در تسکهای استدلالی قابلراستیآزمایی، عملکردی برابر با مدلهای بسیار بزرگتر مانند Gemini 3 Pro دارد. این مدل از یک خط لوله پس-آموزشی تخصصی برای فشردهسازی تواناییهای استدلال پیچیده استفاده میکند.

محققان با معرفی روش «تفکر مبنیساز»، مدلهای کوچک را قادر ساختند تا گامهای استدلالی خود را به نقاط دقیق تصویر متصل کنند. این رویکرد باعث شد مدل Gemma3-4B-IT در استدلالهای مکانی، عملکرد مدل بسیار بزرگتر Gemma3-27B-IT را به دست آورد یا حتی از آن پیشی بگیرد.

پروژه llcore نشان میدهد تکیه بر مشاهده رفتار مدل برای تضمین پایداری، یک توهم است و ۸۴ درصد شکستهای خطرناک را نادیده میگیرد. تنها گواهینامههای ریاضی میتوانند پایداری را تضمین کنند، هرچند هزینه محاسباتی آنها بسیار بالاست.

مدلهای زبانی بزرگ در بنچمارکهای حقوقی نمرات بالایی کسب میکنند، اما در واقعیت منطق را اجرا نمیکنند. پژوهشی جدید نشان میدهد این مدلها با تقلید از نتایج حلکنندههای رسمی، توهمی از استدلال ایجاد میکنند که به آن «پولشویی دامنه» میگویند.

چارچوب RecourseBench با معرفی یک خط لولهی پنجلایه، امکان ارزیابی سیستماتیک و تکرارپذیر روشهای بازگشت الگوریتمی را فراهم کرده است. این ابزار با اعتبارسنجی ۲۸ متد پیشرو، شکاف میان ادعاهای کیفی و نتایج کمی در تبیینپذیری هوش مصنوعی را پر میکند.

ابزارهای تبدیل صوت به متن محلی در مکهای سری M جایگزین سرویسهای ابری شدهاند. Snaply.ai به دلیل رایگان بودن، قابلیت آفلاین و تمرکز بر حریم خصوصی، به پیشنهاد اول کاربران تبدیل شده است.

عاملهای کدنویسی هوش مصنوعی سریعتر از چرخههای بررسی سنتی حرکت میکنند و اغلب ویژگیهایی میسازند که از نظر فنی درست، اما با هدف محصول متفاوت است. راهکار جدید، «توسعهی سِپکمحور» است که در آن یک سند اجرایی مشترک پیش از شروع کدنویسی نهایی میشود.

یک توسعهدهنده با استفاده از استراتژی مسیریابی لایهای، هزینه ماهانه ترجمه را از ۵۰۰ دلار به ۱۱.۴۲ دلار کاهش داد. این سیستم مدلهای گرانقیمت را برای کارهای ساده حذف و جایگزین آنها را با مدلهای تخصصی و ارزانتر میکند.

هوش مصنوعی تنها تهدیدی برای انتخابات نیست، بلکه ابزاری برای بازسازی دموکراسی است. از پاکسازی لیستهای رایدهندگان تا پیشبینی بیخانمانی، این فناوری مدیریت دولتی را از یک ساختار خشک به یک گفتگوی فعال تبدیل میکند.

مهاجمان با بهرهبرداری از آسیبپذیری «نایب سرگردان» در ربات پشتیبانی متا، ۲۰ هزار حساب اینستاگرام را بدون نیاز به رمز عبور تصاحب کردند. این اتفاق شکاف امنیتی بحرانی در عاملهای هوش مصنوعی را فاش کرد: حذف درایت انسانی در تأیید درخواستهای مشکوک.

گوگل کلاد استاندارد Open Knowledge Format (OKF) v0.1 را برای تبدیل دانش پراکنده سازمانی به یک گراف متنی قابل انتقال معرفی کرد. این فرمت با تکیه بر Markdown و YAML، امکان مدیریت متادیتا به عنوان کد را فراهم میکند تا خطاهای استنتاج در عاملهای هوش مصنوعی کاهش یابد.