تصور کنید سرعت تیم برنامهنویسی شما ۳۰٪ بیشتر شده، اما کیفیت محصول در حال سقوط است؛ این همان تلهای است که معیارهای سنتی DORA برای شما میسازند. اگر امروز فقط به داشبوردهای تحویل کد اعتماد میکنید، احتمالاً در حال تماشای یک «پوسیدگی خاموش» در بدنه کدهای خود هستید.
به نقل از یک تحلیل تخصصی در ۸ ژوئن ۲۰۲۶، ابزارهایی مثل GitHub Copilot و Cursor متغیرهای ریسک را از خط لوله (pipeline) به پرامپت منتقل کردهاند. در این فضای جدید، هوش مصنوعی زاینده (Generative AI) — مثل دستیاری که هزاران کتاب را حفظ کرده و سریع جواب میدهد اما منطق پشت هر پاسخ را نمیداند — کدهایی تولید میکند که سرعت تحویل را بالا میبرد اما لزوماً درست نیستند.
همانطور که در تحلیلهای پیشین ما دربارهی ریسکهای اتوماسیون کد اشاره کردیم، نرخ پذیرش پیشنهادات AI لزوماً با کیفیت نهایی کد همبستگی ندارد. بر اساس مستندات منتشر شده، سازمانها برای مدیریت این وضعیت به یک سیستم دو لایه نیاز دارند:
- لایه ارزیابی (Evaluation Layer): رصد نرخ پذیرش هر پیشنهاد، همبستگی بین پیشنهادات و نقصهای فنی، و دفعات جایگزینی کد توسط انسان.
- لایه حاکمیتی (Governance Layer): چارچوبی منعطف که با استفاده از تلهمتری (Telemetry) — شبیه به جعبهسیاه هواپیما که هر حرکت خلبان را برای تحلیل علت سقوط ثبت میکند — آستانههای حساس را تعیین کرده و در صورت نیاز، دسترسی به ابزار را محدود میکند.
طبق گزارش مایکروسافت در آوریل ۲۰۲۶، سیاستهای حاکمیتی باید با سرعت رشد مدلها پیش بروند. این تغییر، مدیریت هوش مصنوعی را از «تیاتر سیاستگذاری» (بحثهای نظری در جلسات) به «مدیریت دادهمحور» تبدیل میکند. برای یک لید فنی، این یعنی ارزیابی کاربردی بودن ابزار به جای تمرکز صرف بر سرعت.
گام بعدی شما
- یک وبهوک (Webhook) ساده یا فایل SQLite برای ثبت نرخ پذیرش و اصلاحات دستی در کدهای AI راهاندازی کنید.
- سه آستانهی مشخص (مثلاً نرخ خطای بالای ۱۰٪ در یک ماژول) برای توقف موقت استفاده از ابزار تعریف کنید.
- یک مسئول مشخص برای مدیریت مسیر تصمیمگیری بر اساس دادههای تلهمتری تعیین کنید.
این تنها آغاز ماجراست؛ اثر این رویکرد بر عملکرد مدلهای استدلالی در گزارش بعدی بررسی خواهیم کرد.
گفتگو