GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

تحلیل Diplomat: ۸۳٪ از فراخوانی‌های ابزاری عامل‌های هوش مصنوعی فاقد گارد هستند

·۱۳ خرداد ۱۴۰۵۸ دقیقه مطالعه
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

نخستین شناسایی آماری از نبودِ گارد امنیتی در سطح کد برای توابع عامل‌های هوش مصنوعی؛ برخلاف بحث‌های کلی درباره توهم، این گزارش مستقیماً روی «دسترس‌های غیرمجاز» در سه کتابخانه کلیدی تمرکز دارد.

اگر عامل‌های هوش مصنوعی شما اجازه دسترسی به پایگاه داده یا حذف فایل‌ها را دارند، احتمالاً یک حفره امنیتی بزرگ در سیستم‌تان دارید. باید بدانید که در بسیاری از پیاده‌سازی‌های فعلی، لایه‌های حفاظتی سنتی نادیده گرفته شده‌اند.

یک عامل (Agent) — شبیه به یک کارمند دیجیتال که می‌تواند نرم‌افزارهای مختلف را برای شما اجرا کند — برای انجام هر کار نیاز به فراخوانی ابزار (Tool Call) دارد؛ یعنی در واقع از مدل می‌خواهد دستور خاصی را به سیستم بفرستد. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های بازمتن دیدیم، اعتماد بیش از حد به لایه‌ی استقرار، همیشه خطرناک است. در برنامه‌های وب سنتی، دکمه‌های رابط کاربری و میان‌افزارها جلوی دسترسی‌های غیرقانونی را می‌گیرند، اما در سیستم‌های عامل‌محور، مدل زبانی خودش تصمیم می‌گیرد چه تابعی را با چه آرگومانی اجرا کند و عملاً این لایه‌ها را دور می‌زند.

طبق اعلام سازندهٔ diplomat-agent-ts در ۳ ژوئن ۲۰۲۶، اسکن امنیتی روی سه پروژهٔ OpenClaw، Mastra و OpenAI Agents JS نتایج تکان‌دهنده‌ای داشت. بر اساس این مستندات، از مجموع ۶۶۹ تابع بررسی‌شده، ۵۵۳ مورد هیچ گارد امنیتی نداشتند:

  • در پکیج‌های OpenAI Agents JS، نرخ شکست بسیار بالا بود و ۹۴٪ فراخوانی‌ها هیچ بررسی امنیتی نداشتند.
  • فراخوانی‌های «تخریبی» مانند اجرای دستورات شل (Shell) و زیرپردازش‌ها شایع‌ترین موارد بودند و ۴۸۶ بار تکرار شدند.
  • این شکاف‌ها دقیقاً با استانداردهای امنیتی OWASP برای سیستم‌های عامل‌محور، به‌ویژه موارد ASI-01 (عاملیت بیش از حد) و ASI-03 (به خطر افتادن امتیازات دسترسی) در تضاد هستند.

این لغزش به معنای آسیب‌پذیری مطلق تمام اپلیکیشن‌ها نیست، اما یک «شکاف موجودی» خطرناک را نشان می‌دهد. بسیاری از گاردها در لایه‌هایی مخفی شده‌اند که اسکنرهای استاتیک نمی‌بینند. تحلیل ما این است که برنامه‌نویسان دیگر نمی‌توانند به لایه‌ی استقرار تکیه کنند. امنیت نباید در رابط کاربری باشد، بلکه باید دقیقاً در کنار کدِ فراخوانی قرار بگیرد.

گام بعدی شما

  • اگر از زبان تایپ‌اسکریپت برای ساخت عامل‌ها استفاده می‌کنید، همین حالا دستور npx @diplomat-ai/diplomat-agent-ts scan . را اجرا کنید.
  • در گزارش نهایی، به دنبال برچسب «no_checks» بگردید تا پرخطرترین قابلیت‌های عامل خود را شناسایی کنید.
  • برای هر تابعی که اثر جانبی (Side Effect) دارد، یک لایه‌ی اعتبارسنجی ورودی مستقیم در سطح کد تعریف کنید.

اما داستان سخت‌افزاری این تحولات حتی شگفت‌انگیزتر است؛ برای درک اینکه پردازش‌های امنیتی چطور روی سخت‌افزار اثر می‌گذارند، به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

چرا این موضوع مهم است؟

این گزارش با استناد به تحلیل استاتیک کدهای منبع، یک نقطه ضعف ساختاری در حاکمیت عامل‌های هوش مصنوعی را افشا می‌کند. این موضوع باعث می‌شود شرکت‌ها مجبور شوند استانداردهای امنیتی خود را از لایه‌ی UI به لایه‌ی کد منتقل کنند تا از اجرای دستورات مخرب جلوگیری شود.

تأثیر برای ایران

برای توسعه‌دهندگانی در ایران که با فریم‌ورک‌های TypeScript و LangChain عامل‌های داخلی می‌سازند، استفاده از اسکنر Diplomat برای شناسایی حفره‌های امنیتی پیش از استقرار، یک ضرورت فنی است.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما نشان می‌دهد که ما در حال انتقال از «امنیت محیطی» به «امنیت تابعی» هستیم. در دنیای وب، ما دور حصار می‌کشیدیم، اما در عصر عامل‌ها، هر تابع باید حصار خودش را داشته باشد. این تغییر پارادایم یعنی امنیت دیگر یک لایهٔ جانبی نیست، بلکه بخشی از هستهٔ منطقی برنامه است.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه