
فشردهسازی ۶ برابری تفکر: مایکروسافت چگونه هزینه استنتاج را کاهش داد؟
مایکروسافت با معرفی OpenMementos، روشی برای جایگزینی استدلالهای طولانی با خلاصههای فشرده ارائه کرد. این متد مصرف توکنها را تا ۶ برابر کاهش میدهد بدون آنکه دقت مدل در مسائل…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۳ مقاله منتشر شده

مایکروسافت با معرفی OpenMementos، روشی برای جایگزینی استدلالهای طولانی با خلاصههای فشرده ارائه کرد. این متد مصرف توکنها را تا ۶ برابر کاهش میدهد بدون آنکه دقت مدل در مسائل…

مدل جدید xAI با نام grok-voice-think-fast-1.0 با حذف تأخیرهای مکالمهای، رقبای خود یعنی Gemini و GPT را در بنچمارکهای صوتی شکست داد. این سیستم هماکنون در پشتیبانی مشتریان…

مدل TinyR1-32B-Preview با وجود اندازه کوچکتر، رقیب ۷۰ میلیاردی خود را در بنچمارکهای استدلالی شکست داد. این دستاورد از طریق ترکیب متخصصهای دامنهای و استفاده از ابزار Mergekit…

پژوهشگران با معرفی ClawGym، راهکاری برای آموزش عاملهای هوش مصنوعی قادر به اجرای گردشکارهای پیچیده محلی ارائه دادند. این سیستم با تولید ۱۳.۵ هزار تسک مصنوعی و یک بنچمارک…

یک چارچوب پژوهشی جدید، متد TDD را به عنوان یک لایهی حاکمیتی سختگیرانه برای تولید کد توسط عاملهای AI معرفی کرده است. این سیستم با جداسازی پیشنهادهای مدل از مرجع تصمیمگیرنده،…

پژوهشگران چارچوب جدیدی به نام AGEL-Comp را معرفی کردند که با ترکیب منطق نمادین و شبکههای عصبی، ضعف مدلهای زبانی در حل تکالیف پیچیده را برطرف میکند. این سیستم با جایگزینی…

هوش مصنوعی اغلب در ۳۰ درصد پایانی کارهای پیچیده شکست میخورد و باعث کاهش بهرهوری میشود. راهکار خروج از این بنبست، جایگزینی پرامپتهای ساده با یک گردشکار ساختاریافته و مبتنی بر…

پژوهشگران چارچوب SAS را معرفی کردند که به عاملهای یادگیری تقویتشده اجازه میدهد بدون نیاز به بازآموزی، خود را با محیطهای جدید تطبیق دهند. این سیستم با استفاده از «تخیل…

پژوهشگران با خلق مجموعهداده Naamah، بیش از ۱۰۰ هزار جمله مصنوعی برای زبان سانسکریت تولید کردند تا مشکل کمبود داده در شناسایی موجودات نامگذاری شده را حل کنند. این پروژه ثابت…

IBM با معرفی خانوادهی Granite 4.1 ثابت کرد که مدلهای کوچکتر با دادههای باکیفیت میتوانند مدلهای غولپیکر را شکست دهند. نسخهی ۸ میلیاردی این مدل در بنچمارکهای کلیدی، عملکرد…

پژوهشگران مجموعهداده عظیم و چندوجهی CheXthought را معرفی کردند که مسیر تفکر و نقاط تمرکز رادیولوژیستها را ثبت کرده است. این ابزار با آموزش مدلها برای «دیدن» مانند انسان، توهمات…

محققان روشی به نام DIRECT ابداع کردهاند که به مدلهای عصبی اجازه میدهد بدون نیاز به پسانتشار (Backpropagation)، جهت علت و معلول را یاد بگیرند. این دستاورد، مسیر را برای ساخت…