
MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از دادهها
چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلالهای اجتماعی پیچیده را با بهرهگیری از تنها ۳۰٪ از مجموعهداده IntentTrain بهینهسازی کرده است. این مدل با تمرکز بر…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۵۴ مقاله منتشر شده

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلالهای اجتماعی پیچیده را با بهرهگیری از تنها ۳۰٪ از مجموعهداده IntentTrain بهینهسازی کرده است. این مدل با تمرکز بر…

پژوهشی در ۱۱ ژوئن ۲۰۲۶ نشان میدهد که با استفاده از بهینهسازی DR-Submodular میتوان تلخیص دادهها را هدف قرار داد. این روش با تغییر ساختار شباهت دادهها، عملکرد مدلهای…

AutoMine با ترکیب مدلهای زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از دادههای حجیم را ممکن کرده است. این چارچوب با استفاده از حلقهی اصلاح کد، توانست در رقابت…

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کردهاند. این رویکرد با تحلیل کل جریان داده بهجای تمرکز…

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاهها، مدلهای زبانی را قادر ساخت تا باورهای تودرتو را بهطور دقیق مدلسازی کنند. این متد با بهرهگیری از GPT-5.4 و…

محققان مدل Lung-R1 را توسعه دادهاند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی سادهی حقایق به استدلال تشخیصی بیمار-محور حرکت میکند. این…

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنالهای UCB، مانع از گیر کردن عاملهای هوش مصنوعی در مسیرهای بنبست میشود. این رویکرد ثابت میکند که برای…

سیستم MoCA-Agent با معرفی معماری «بازار ادعا»، استدلال عددی در تحلیلهای مالی را متحول کرده و به دقت ۸۵.۶٪ در بنچمارک FinChart-Bench رسیده است. این مدل بهجای بحثهای متنی، بر…

کتابخانهی TypeScript جدیدی به نام reactive-fsm با استفاده از ماشینهای حالت ساختاری، مانع از فراخوانی نادرست ابزارها توسط عاملهای هوش مصنوعی میشود. این ابزار به جای تکیه بر…

بازیابی کامل اسناد به معنای پاسخ درست نیست. چارچوب RAGAS با استفاده از مدلهای داور، معیار «وفاداری» یا Faithfulness را میسنجد تا مشخص شود هر ادعای مدل واقعاً در متن موجود است یا…

مهندسی هوش مصنوعی از رپرهای سادهی API به سمت سیستمهای عاملمحور و تخصصی حرکت میکند. توسعهدهندگان برتر اکنون برای دستیابی به پایداری و کاهش هزینه، بر RAG عاملمحور و مدلهای…

انتروپیک برای شناسایی الگوهای سوءاستفاده پیشرفته، ذخیرهسازی اجباری دادهها به مدت ۳۰ روز را برای مدلهای کلاس Mythos الزامی کرد. این تصمیم به معنای حذف گزینهی «عدم ذخیرهسازی…