
«از بازرس به ویراستار»؛ اثر معکوس کردن تحلیل و امتیازدهی
یک توسعهدهنده کشف کرد که مدلهای ارزیاب هوش مصنوعی وقتی پیش از تحلیل، به متن امتیاز میدهند، بازخوردهایی «صرفاً درست» اما سطحی ارائه میکنند. با معکوس کردن این ترتیب و اولویت…
موضوع
Autonomous agents, tool use, planning, multi-step workflows
۱٬۴۷۳ مقاله منتشر شده

یک توسعهدهنده کشف کرد که مدلهای ارزیاب هوش مصنوعی وقتی پیش از تحلیل، به متن امتیاز میدهند، بازخوردهایی «صرفاً درست» اما سطحی ارائه میکنند. با معکوس کردن این ترتیب و اولویت…

یک ابزار خط فرمان (CLI) جدید با تحلیل فایلهای diff، خطاهای پنهانی مانند نبودِ تست یا تغییرات خطرناک در وابستگیها را پیش از ادغام کد شناسایی میکند. این ابزار روی شکستهای «ساکت»…

یک بسته نرمافزاری مخرب با دور زدن هفت لایه امنیتی مبتنی بر هوش مصنوعی، باعث سرقت گسترده اعتبارنامهها شد. این بحران تنها زمانی پایان یافت که یک فایل جعلی، عامل هوش مصنوعی مهاجم…

شرکت Anthropic با معرفی Claude Tag، امکان فراخوانی مشترک Claude Code را در محیط Slack فراهم کرد. این قابلیت اجازه میدهد عاملهای هوش مصنوعی با دسترسی به تاریخچه گفتگوها، وظایف…

شرکت Armorer Labs استدلال میکند که گزارشهای مشترک برای حسابرسی سامانههای چندعاملی ناکافی هستند. این شرکت الگوی «رسید تحویل» را برای ردیابی دقیق پرامپتها، اعتبارنامهها و…

شرکت monday.com سامانه HATCHA را معرفی کرد؛ نسخهای معکوس از CAPTCHA که دسترسی انسانها را میبندد و فقط به عاملهای هوش مصنوعی اجازه ورود میدهد. این ابزار با استفاده از محاسباتی…

توسعهدهندگان برای فرار از هزینههای پنهان مسیریابی در تجمیعکنندههای هوش مصنوعی، به سمت بازارگاههای توکن با قیمت شفاف کوچ میکنند. پلتفرم OpenModels جایگزینی بدون کارمزد برای…

چارچوب متنباز agent-runbook با جایگزینی دستورات مبهم با قراردادهای ساختاریافته، از بروز خطاهای سیستمی عاملهای هوشمند در محیطهای عملیاتی جلوگیری میکند. این ابزار با اجبار به…

متخصصان حوزه در حال گذار از پرامپتهای مبهم به «توسعهٔ مبتنی بر مشخصات» (Spec-driven development) هستند تا حدسهای غلط هوش مصنوعی را حذف کنند. ابزارهایی مانند BrainGrid اکنون…

یک جعبهابزار جدید برای متخصصان املاک نشان میدهد که چگونه مهندسی پرامپت ساختاریافته میتواند پاسخهای تکراری هوش مصنوعی را حذف کند. با تعریف دقیق نقشها و محدودیتها، مشاوران…

OpenAI و Broadcom تراشه اختصاصی Jalapeño را برای کاهش هزینههای عملیاتی استنتاج مدلهای زبانی معرفی کردند. این حرکت گلوگاه هوش مصنوعی را از قدرت محاسباتی خام به مدیریت ارکستراسیون…

یک راهنمای جامع فنی، بازسازی معماری عامل نانوبات را از پایه آموزش میدهد. این متد شامل پیادهسازی فراخوانی ابزار، حافظه نشست و سرورهای MCP در یک حلقه مستقل از ارائهدهنده است.