
کمبود «هوش محیطی» دلیل شکست عاملهای کدنویس در مقیاس صنعتی است
عاملهای هوش مصنوعی با وجود توانایی تولید کدهای صحیح، به دلیل عدم درک وابستگیهای سیستمی در محیطهای عملیاتی شکست میخورند. رویکردهای جدیدی مانند RapidKit قصد دارند با ایجاد یک…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۰ مقاله منتشر شده

عاملهای هوش مصنوعی با وجود توانایی تولید کدهای صحیح، به دلیل عدم درک وابستگیهای سیستمی در محیطهای عملیاتی شکست میخورند. رویکردهای جدیدی مانند RapidKit قصد دارند با ایجاد یک…

یک لایهی ایمنی جدید هشدار میدهد که عاملهای هوش مصنوعی میتوانند خطاهای قیمتگذاری را در حلقههای تکراری چندبرابر کنند. راهکار پیشنهادی، مکانیزم «توقف بسته» است که در صورت نبود…

انویدیا با معرفی پلتفرم Rubin، سیستم خنککننده بسته با دمای ۴۵ درجه را جایگزین فنها و چیلرهای سنتی کرد. این تغییر معماری، «مالیات خنککردن» ۴۰ درصدی برق را حذف کرده و مصرف آب در…

پروژه متنباز MoonMath با معرفی یک هسته تخصصی Attention، توان عملیاتی پردازندههای MI300X را در تمامی حالتهای آزمایشی نسبت به کتابخانه رسمی AITER v3 افزایش داد. این دستاورد از…

توسعه عاملهای آماده برای تولید در سال ۲۰۲۶ نیازمند گذار از پرامپتهای ساده به ابزارهای تخصصی اتوماسیون مرورگر و حافظه پایدار است. این پشته تکنولوژیک بر رفع گلوگاههای اصلی مانند…

یک الگوی رایج در کدهای تولیدشده توسط هوش مصنوعی باعث ایجاد توابعی میشود که دادهها را اعتبارسنجی و ثبت میکنند، اما عملیات ذخیرهسازی در پایگاهداده را فراموش میکنند. این خطا در…

تحلیل امنیتی کدهای تولیدشده توسط هوش مصنوعی، پنج الگوی منطقی رایج را شناسایی کرد که ابزارهای بررسی کد (Linter) قادر به تشخیص آنها نیستند. این خطاها منجر به شکستهای خاموش و…

مقیاسپذیری عاملهای هوش مصنوعی از ابزارهای شخصی به همکاری تیمی، نیازمند زیرساخت ارتباطی است، نه فقط مدلهای قویتر. پروژه Octo نشان میدهد استفاده از معماری پیامرسانهای فوری…

شرکت Sakana AI سامانه Fugu را معرفی کرد که با مدیریت پویا مجموعهای از مدلهای زبانی مختلف، در تکالیف پیچیده استدلالی و کدنویسی از مدلهای تکسرویس پیشرو پیشی میگیرد. این سیستم…

تلاش برای رفع خطاهای عاملهای هوش مصنوعی از طریق اصلاح پرامپت، اغلب باعث پنهان شدن شکستهای عمیق در لایهی تبادل دادهها میشود. ابزار جدید ccglass با فراهم کردن امکان مشاهدهی…

پروژهی متنباز Aegis با استفاده از معماری دومسیره و انتقال عملیات رمزنگاری به زبان Rust، تأخیر پاسخدهی به کاربران را به نزدیکی صفر رسانده است. این گزارش گلوگاه بحرانی زبان…

محک جدید CivBench نشان میدهد مدلهای زبانی پیشرو در حالی که استراتژیهای پیچیده را بهخوبی توصیف میکنند، در اجرای آنها در بلندمدت شکست میخورند. این آزمایشها «اثر سنسوریوم» را…