
شکاف اعتماد در کدنویسی: مدلهای محلی Qwen در تکالیف پیچیده شکست میخورند
تستهای عملی روی مدلهای محلی Qwen نشان میدهد که با وجود مزیت حریم خصوصی، این مدلها در مدیریت پروژههای کدنویسی طولانی دچار «حلقههای تکرار» میشوند. این یافتهها فاصلهٔ…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۴۹۶ مقاله منتشر شده

تستهای عملی روی مدلهای محلی Qwen نشان میدهد که با وجود مزیت حریم خصوصی، این مدلها در مدیریت پروژههای کدنویسی طولانی دچار «حلقههای تکرار» میشوند. این یافتهها فاصلهٔ…

شرکت iFLYTEK با معرفی Astron Skillhub و Astron Agent، مدیریت عاملهای هوش مصنوعی را از پرامپتهای یکپارچه به مهارتهای ماژولار و کنترلشده منتقل کرد. این چارچوب جدید لایههای…

برنامهنویسان با استفاده از فایلهای زمینهی اختصاصی مانند CLAUDE.md، استانداردهای معماری را برای عاملهای هوش مصنوعی اجباری میکنند. این روش خطاهای رایج در پروژههای Next.js…

شرکت انتروپیک پروتکل زمینه مدل (MCP) را معرفی کرد تا نیاز به نوشتن کدهای رابط جداگانه برای هر ابزار یا پایگاه داده را از بین ببرد. این استاندارد مانند یک رابط جهانی عمل میکند تا…

عاملهای هوش مصنوعی کدنویس، مستندات و اسکریپتهای غیرفعال را به ورودیهای فعال تبدیل میکنند. این تغییر باعث میشود یادداشتهای قدیمی و تنظیمات پنهان به نقاط آسیبپذیر برای تزریق…

انویدیا ابزار SkillSpector را برای شناسایی آسیبپذیریهای امنیتی در مهارتهای عاملهای هوشمند عرضه کرد. این سامانه با تحلیل ایستا و گردشکارهای LangGraph، ریسکهایی مثل تزریق…

توسعهدهندگان اکنون میتوانند با استفاده از SDKهای استاندارد OpenAI، مدلهای DeepSeek را بدون تغییر در کد سازگار کنند. این انتقال باعث کاهش شدید هزینههای عملیاتی میشود در حالی…

آمازون ابزار جستوجوی وب را به Bedrock AgentCore اضافه کرد، اما تغییر بنیادین در نحوه برخورد با نتایج است. هدف اکنون تبدیل جستوجو به «شواهد متصل» برای auditing است تا مسیر…

شرکت MiniMax مدل M3 را با قابلیتهای کدنویسی پیشرفته و پنجره متنی یک میلیون توکنی بهصورت وزنهای باز منتشر کرد. این مدل با ادغام قابلیتهای چندوجهی و استدلال، رقابت مستقیمی با…

شرکت Stormchaser راهکاری برای حذف تأخیرهای متوالی در عاملهای خودکار معرفی کرده است. این متد با ترکیب پردازش ناهمگام و حافظه معنایی، زمان اجرای عملیات را از چندین ثانیه به ۲۰۰…

آمازون سرویس AWS Security Agent را برای شناسایی خودکار نقاط ضعف و اجرای تستهای نفوذ در طول چرخه توسعه معرفی کرد. این ابزار با معماری چندعاملی، مسیرهای پیچیده حمله را که اسکنرهای…

شرکت OpenAI صفحه اختصاصی «زمانبندیشده» را در ChatGPT معرفی کرد تا کاربران بتوانند پرامپتها را برای اجرا در آینده تنظیم و مدیریت کنند. این بهروزرسانی قابلیتهای خودکارسازی را…