تحلیل و بررسی تخصصی

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلال‌های اجتماعی پیچیده را با بهره‌گیری از تنها ۳۰٪ از مجموعه‌داده IntentTrain بهینه‌سازی کرده است. این مدل با تمرکز بر…

تحلیل و بررسی تخصصی۲ هفته پیش

بهینه‌سازی DR-Submodular: روشی برای تخریب سیستماتیک تلخیص داده‌ها در هوش مصنوعی

پژوهشی در ۱۱ ژوئن ۲۰۲۶ نشان می‌دهد که با استفاده از بهینه‌سازی DR-Submodular می‌توان تلخیص داده‌ها را هدف قرار داد. این روش با تغییر ساختار شباهت داده‌ها، عملکرد مدل‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

AutoMine: کسب امتیاز ۷۷.۲۱ در چالش سناریوهای Argoverse 2

AutoMine با ترکیب مدل‌های زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از داده‌های حجیم را ممکن کرده است. این چارچوب با استفاده از حلقه‌ی اصلاح کد، توانست در رقابت…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا بررسی مدل برای تطبیق با قانون هوش مصنوعی اتحادیه اروپا کافی نیست؟

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کرده‌اند. این رویکرد با تحلیل کل جریان داده به‌جای تمرکز…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاه‌ها، مدل‌های زبانی را قادر ساخت تا باورهای تودرتو را به‌طور دقیق مدل‌سازی کنند. این متد با بهره‌گیری از GPT-5.4 و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

Lung-R1: عبور از بازیابی اطلاعات به استدلال تشخیصی با گراف دانش

محققان مدل Lung-R1 را توسعه داده‌اند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی ساده‌ی حقایق به استدلال تشخیصی بیمار-محور حرکت می‌کند. این…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنال‌های UCB، مانع از گیر کردن عامل‌های هوش مصنوعی در مسیرهای بن‌بست می‌شود. این رویکرد ثابت می‌کند که برای…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

MoCA-Agent: دستیابی به دقت ۸۵.۶٪ در تحلیل مالی با معماری بازار ادعا

سیستم MoCA-Agent با معرفی معماری «بازار ادعا»، استدلال عددی در تحلیل‌های مالی را متحول کرده و به دقت ۸۵.۶٪ در بنچمارک FinChart-Bench رسیده است. این مدل به‌جای بحث‌های متنی، بر…

۱ دقیقه خواندن

ماشین حالتی برای جلوگیری از فراخوانی اشتباه ابزار توسط LLM

آموزش کاربردی۳ هفته پیش

جایگزینی پرامپت با ماشین حالت: روشی برای توقف خطاهای ابزاری در عامل‌های AI

کتابخانه‌ی TypeScript جدیدی به نام reactive-fsm با استفاده از ماشین‌های حالت ساختاری، مانع از فراخوانی نادرست ابزارها توسط عامل‌های هوش مصنوعی می‌شود. این ابزار به جای تکیه بر…

۵ دقیقه خواندن

سری تست RAG — قسمت ۳: تشخیص وفاداری و توهم

آموزش کاربردی۳ هفته پیش

چرا بازیابی دقیق اسناد تضمینی برای توقف توهمات هوش مصنوعی نیست؟

بازیابی کامل اسناد به معنای پاسخ درست نیست. چارچوب RAGAS با استفاده از مدل‌های داور، معیار «وفاداری» یا Faithfulness را می‌سنجد تا مشخص شود هر ادعای مدل واقعاً در متن موجود است یا…

۱۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی

مهندسی هوش مصنوعی از رپرهای ساده‌ی API به سمت سیستم‌های عامل‌محور و تخصصی حرکت می‌کند. توسعه‌دهندگان برتر اکنون برای دستیابی به پایداری و کاهش هزینه، بر RAG عامل‌محور و مدل‌های…

۶ دقیقه خواندن

اخبار کوتاه روزانه۳ هفته پیش

چرا مدل‌های Mythos انتروپیک دیگر از حریم خصوصی ZDR پشتیبانی نمی‌کنند؟

انتروپیک برای شناسایی الگوهای سوءاستفاده پیشرفته، ذخیره‌سازی اجباری داده‌ها به مدت ۳۰ روز را برای مدل‌های کلاس Mythos الزامی کرد. این تصمیم به معنای حذف گزینه‌ی «عدم ذخیره‌سازی…

۳ دقیقه خواندن