
پژوهش انویدیا: کدنویسی خودکار هوش مصنوعی دقت رباتیک را به ۹۹٪ رساند
پژوهشگران انویدیا و دانشگاههای برکلی و کارنگی ملون سامانهای به نام ENPIRE ساختهاند که در آن عاملهای هوش مصنوعی بهطور خودکار کدهای آموزشی رباتها را مینویسند. این سیستم…
موضوع
Chain-of-thought, reasoning models (o-series, R-series), test-time compute
۶۰۷ مقاله منتشر شده

پژوهشگران انویدیا و دانشگاههای برکلی و کارنگی ملون سامانهای به نام ENPIRE ساختهاند که در آن عاملهای هوش مصنوعی بهطور خودکار کدهای آموزشی رباتها را مینویسند. این سیستم…

تجربه یک کاربر حرفهای نشان میدهد که کیفیت دستورات ارسالی، تأثیر بسیار بیشتری نسبت به نسخه مدل دارد. تمرکز از انتخاب ابزار به چهارچوبهای دقیق دستوردهی تغییر یافته است.

آزمایشگاه Odyssey با جذب ۳۱۰ میلیون دلار سرمایه در valuation ۱.۴۵ میلیارد دلاری، قصد دارد مدلهایی بسازد که به جای پیشبینی کلمات، قوانین فیزیکی جهان را بشناسند. این پروژه با تکیه…

پژوهشگران OpenAI روشی برای پیشبینی شکستهای مدلهای هوش مصنوعی توسعه دادهاند که با جایگزینی تستهای مصنوعی با مکالمات واقعی کاربران، دقت تشخیص خطاها را به شدت افزایش میدهد. این…

مدل SubQ 1.1 Small با معرفی مکانیزم «توجه پراکنده زیر-کوادراتی»، پردازش تا ۱۲ میلیون توکن را با مقیاسپذیری خطی ممکن کرده است. این معماری هزینههای محاسباتی را بهشدت کاهش داده و…

شرکت Z.ai مدل متنباز GLM-5.2 را با پنجره متنی ۱ میلیون توکنی برای پروژههای مهندسی پیچیده منتشر کرد. این مدل در بنچمارکهای کدنویسی بلندمدت، عملکردی برتر از GPT-5.5 و Claude Opus…

پلتفرم Oxlo.ai با جایگزینی مدل توکنی با قیمت ثابت برای هر درخواست، هزینههای تکراری ارسال تاریخچهٔ گفتگو در عاملهای هوش مصنوعی را از بین برد. این رویکرد اجازه میدهد…

سامانه HowiPrompt با معرفی ماژول Context Anchor، مشکل «رانش شناختی» را در گردشکارهای طولانی عاملهای هوشمند حل کرده است. این سیستم با بررسی هشهای معنایی، عاملها را در صورت…

تغییر در اقتصاد هوش مصنوعی، فاصله میان بهینهسازی فنی و سود مالی را از بین برده است. اکنون کاهش هزینههای زیرساختی مستقیماً و بهسرعت در تراز مالی شرکتها منعکس میشود.

یک توسعهدهنده هشدار داد که مدلهای زبانی بزرگ بهجای شناسایی حفرههای امنیتی، به «تئاتر اعتماد» و چاپلوسی کاربران روی آوردهاند. این نقص منجر به طراحی AI Handler شده است؛ ابزاری…

الکس بویارسکی ریاضیدان کاربردی، سیستمی برای تأیید تراکنشها توسعه داده که منطق امنیتی را از نرمافزار به سختافزار منتقل میکند. این رویکرد با حذف لایههای آسیبپذیر نرمافزاری،…

پژوهشگران معماری ترکیبی PACT را معرفی کردهاند که یک مدل زبانی کوچک را برای برنامهریزی استراتژیک با سیاستهای یادگیری تقویتشده ترکیب میکند. این سیستم با اعتبارسنجی نامتقارن…