
رابط کد-محور در برابر فراخوانی صلب ابزار در مدلهای بینایی-زبانی
انویدیا چارچوب SpatialClaw را معرفی کرد که بهجای فراخوانیهای صلب ابزار، از کد پایتون بهعنوان رابط اقدام استفاده میکند. این رویکرد باعث شد مدلهای بینایی-زبانی بدون نیاز به…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۳ مقاله منتشر شده

انویدیا چارچوب SpatialClaw را معرفی کرد که بهجای فراخوانیهای صلب ابزار، از کد پایتون بهعنوان رابط اقدام استفاده میکند. این رویکرد باعث شد مدلهای بینایی-زبانی بدون نیاز به…

عاملهای خودگردان در تلهای میافتند که توصیفِ انجام یک وظیفه را با اجرای واقعی آن اشتباه میگیرند. این نقص ساختاری باعث ایجاد حلقههای بیپایان از تفکر داخلی بدون هرگونه خروجی…

محک جدید AA-Briefcase نشان میدهد حتی قدرتمندترین مدلهای زبانی در مواجهه با پروژههای چند هفتهای و دادههای پراکنده شکست میخورند. در حالی که Claude Fable 5 پیشتاز است، نرخ شکست…

تحلیلی فنی روی مدل Gemini 3.5 Flash نشان میدهد که این مدل در شرایط خاص، نتایج جستوجوی لحظهای را نادیده گرفته و به دادههای قدیمی آموزش خود باز میگردد. این «شکاف باور» ریسکی…

صنعت AI از شمارش درخواستها به سمت توکنها حرکت کرده، اما کارشناسان هشدار میدهند که حجم توکن را نباید با هوشمندی یا درآمد یکی دانست. ارزش واقعی در معماری سیستم، بهویژه مدیریت…

پلتفرم Oxlo.ai مدل قیمتگذاری مبتنی بر توکن را با مدل «درخواستمحور» جایگزین کرد تا هزینههای عملیاتی در گردشهای کاری پیچیده پیشبینیپذیر شود. این رویکرد تفاوت میان هزینه پردازش…

پژوهشی جدید در AIS2C2 ۲۰۲۵ چارچوبی را معرفی میکند که به مدلهای زبانی کوچک و بازمتن اجازه میدهد از طریق پرامپتهای ساختاریافته از ابزارهای خارجی استفاده کنند. این روش نیاز به…

گذار از RAG استاندارد به سیستمهای عاملمحور، هوش مصنوعی را از یک «کتابدار» به «مدیر پروژه» تبدیل میکند. این تغییر، موانع زیرساختی جدی از جمله پیچیدگی مسیریابی ابزارها و جهشهای…

تالوس یک مفسر جدید برای WebAssembly است که با استفاده از زبان Lean 4، اجرای کد را با اثبات ریاضی ادغام میکند. این ابزار به توسعهدهندگان اجازه میدهد صحت برنامهها را در همان کدِ…

انویدیا مدل Nemotron 3 Ultra را معرفی کرد که برخلاف مدلهای پیشرو، نه تنها وزنها، بلکه دادههای آموزشی و متدهای ساخت را نیز بهصورت باز منتشر کرده است. این مدل با معماری ترکیبی،…

پروژه متنباز Clioloop با استفاده از مکانیزم «تلفیق عاملمحور»، پاسخهای باکیفیت را از ترکیب چندین مدل کوچک و ارزان تولید میکند. این سیستم با جایگزینی یک مدل واحد و گران با تیمی…

شرکت OpenAI مدل GPT-5.5 Instant را معرفی کرد که در بنچمارکهای بهداشتی، دقت و شفافیتی بیشتر از پزشکان انسانی دارد. این ابزار اکنون برای تمامی کاربران رایگان جهت تحلیل نتایج…