تصور کنید در شرکتی هستید که مدیر شما تصمیم گرفته میلیونها دلار روی ابزاری سرمایهگذاری کند که شما میدانید درست کار نمیکند. اگر گزارشهای فنی شما نادیده گرفته میشوند، تنها راه نجات، صحبت کردن به زبانی است که مدیران ارشد میفهمند: زبانِ بودجه و امنیت. در شرکت NexPay که یک فینتک در حوزه پرداختهای فرامرزی است، مهندسی به نام لینا دقیقاً همین مسیر را طی کرد. او بدون آنکه مستقیماً با رئیس خود مخالفت کند، یک قرارداد چندصد هزار دلاری برای خرید پلتفرم DeepCover AI را که دارای نقصهای جدی بود، خنثی کرد. رویکرد او در واقع تطبیق عملی یکی از استراتژیهای «۳۶ حیله» بود: «کشتن با چاقوی قرضشده»؛ هنر استفاده از طرف دوم برای وارد کردن ضربه نهایی.
این سناریو در زمانی رخ میدهد که بسیاری از سازمانها برای کاهش هزینههای عملیاتی و سرکوب هزینههای دستی، با عجله به دنبال ادغام اتوماسیونهای «مبتنی بر هوش مصنوعی» هستند. شرکتها اغلب با شکافی عمیق بین رؤیای مدیر ارشد فناوری (CTO) در مورد بهرهوری و واقعیتهای تلخ بدهیهای فنی (Technical Debt) و الزامات انطباق روبروند. در دنیای فینتک، جایی که محل ذخیرهسازی دادهها (Data Residency) و دقت محاسبات غیرقابل مذاکره است، یک ابزار «تقریباً خوب»، میتواند به یک ریسک فاجعهبار تبدیل شود.

ریشهٔ تضاد: رؤیای مدیر در برابر واقعیت مهندس
به گزارش منابع داخلی، در جلسه عمومی سه ماهه (Q3 tech all-hands)، وینس (CTO شرکت NexPay)، خرید DeepCover AI را اعلام کرد. او این پلتفرم را به عنوان «تست کاملاً خودکار مبتنی بر هوش مصنوعی» معرفی کرد که ادعا میشد میتواند پوشش تست (Test Coverage) را به بیش از ۹۵٪ برساند و ۱۰ برابر سریعتر از تستهای دستی عمل کند. وینس همچنین مدعی شد که این ابزار پیش از این در سه مشتری فینتکی دیگر تایید شده و هزینه سال اول آن تنها ۲۰۰ هزار دلار است.
لینا که دو سال و نیم بود در نقش معمار ارشد تست (Senior Test Architect) فعالیت میکرد، سبک مدیریت وینس را بهخوبی میشناخت: او ابتدا مدیران اجرایی را متقاعد میکرد و سپس خبر را به تیم مهندسی میداد. وینس به دنبال نظرخواهی نبود، بلکه در حال ابلاغ یک تصمیم قطعی بود. در این میان، لینا تکلیفی سه هفتهای برای ارزیابی فنی این ابزار دریافت کرد.
جزئیات فنی: حفرههای پنهان در DeepCover AI
لینا هفته اول را صرف تحلیل مستندات و یک مقاله سفید (White Paper) صیقلخورده و تبلیغاتی کرد. در هفته دوم، او دادههای واقعی تولید (Production Data) را به صورت ناشناس روی مدل اجرا کرد. در هفته سوم، او به سه شکست حیاتی رسید:
- فقدان استدلال: قابلیت تولید تست، یک مدل استدلالی (Reasoning Model) واقعی نبود. این ابزار در واقع یک موتور الگوهای سختافزاری (Hardcoded Rule Template Engine) بود که از یک رابط ساده مدل زبانی (LLM Wrapper) استفاده میکرد. در حالی که این ابزار میتوانست الگوهای سادهای مثل رمز عبور «درست»، «غلط» یا «خالی» را برای صفحه ورود شناسایی کند، اما فاقد عمق لازم برای مدیریت جریانهای پیچیده (Complex Flows) بود. این محدودیتها در واقع تضاد عجیبی با رویکردهای مدرن توسعه داشت، جایی که ترکیبی از مدلهای کوچک میتوانند رفتارهایی انسانیتر و پایدارتر از مدلهای غولپیکر شبیهسازی کنند و پیچیدگیها را بهتر مدیریت نمایند.
- ناآشنایی با دامنه: موتور این سیستم نمیتوانست کدهای سوئیفت (SWIFT) یا چرخههای تسویه را تشخیص دهد. بهویژه در مورد «محدودیتهای تلاش مجدد در نوسانات نرخ ارز» شکست خورد، چون کتابخانه الگوهایش این شاخه را تعریف نکرده بود و مدل زبانی نیز قادر نبود این شکاف را پر کند.
- گزارش نادیده گرفته شده: لینا گزارشی چهار صفحهای شامل دادهها، اسکرینشاتها و جداول مقایسهای تهیه کرد. اما وینس پس از خواندن تنها دو صفحه، آن را رد کرد و با لحنی دستوری به او گفت: «دوباره نگاه کن و بیش از حد محتاط نباش».
چاقوی اول: سلاحسازی با بودجه
لینا متوجه شد که هشدارهای فنی او توسط مدیر مستقیمش نادیده گرفته میشوند. او استراتژی خود را تغییر داد و به دنبال «چاقوهای قرضشده» گشت. او یک تله قیمتگذاری را شناسایی کرد: مبلغ ۲۰۰ هزار دلاری ذکر شده، «به ازای هر محیط» (Per-environment) بود. از آنجا که استقرار استاندارد به سه محیط (توسعه، استیجینگ و تولید) نیاز داشت، هزینه واقعی سال اول بالای ۶۰۰ هزار دلار بود. علاوه بر این، هزینههای پنهان ذخیرهسازی دادهها از سال دوم فعال میشد.
به جای بحث مستقیم با وینس، لینا در راهرو با اورِت (مدیر عملیات) پس از یک جلسه هماهنگی بین-تخصصی برخورد کرد. او گزارش فنی را به اورت نداد، بلکه خیلی اتفاقی اشاره کرد که ساختار قیمتگذاری با قالب بودجه همخوانی ندارد و پیشنهاد داد بخش مالی قبل از بررسی سه ماهه نگاهی به آن بیندازد.
این اقدام یک واکنش زنجیرهای ایجاد کرد:
۱. اورت قیمتها را برای CFO (مدیر مالی) ارسال کرد.
۲. تحلیلگر مالی مدیر مالی، اعداد را بازبینی کرد (۲۰۰ هزار × ۳ محیط + هزینههای ذخیره).
۳. در جلسه بودجه روز پنجشنبه، CFO جدولی را نمایش داد که تفاوت ۶۰۰ هزار دلار واقعیت را با ادعای ۲۰۰ هزار دلاری وینس نشان میداد.
۴. مدیر مالی مستقیماً وینس را به چالش کشید تا توضیح دهد چگونه باید با این تناقض مالی برخورد کرد.
چاقوی دوم: تلهٔ انطباق و امنیت
لینا در گام دوم روی معماری امنیتی دست گذاشت. او کشف کرد که DeepCover AI از معماری ابری مشترک (Shared-tenant SaaS) استفاده میکند که در آن، دادههای تراکنشهای مالی NexPay از طریق مرکز داده AWS Oregon (us-west-2) مسیریابی میشد. این موضوع مستقیماً با سیاست انطباق (Compliance Policy) شرکت برخورد داشت که صریحاً ذکر کرده بود دادههای مالی نباید از مرز کشور خارج شوند.
بعدازظهر چهارشنبه، لینا در اتاق استراحت با راج (معمار امنیت) گپی زد و پرسید آیا تیم او استقرار در AWS Oregon را بررسی کرده است یا خیر. راج در لحظه واکنشی نشان نداد، اما صبح روز بعد، یک پرچم قرمز (Red Light) رسمی برای CTO، CFO و معاون مهندسی ارسال کرد.
ایمیل راج کوتاه و مرگبار بود: «بند ۴.۳ سیاست انطباق NexPay: دادههای مالی نباید از کشور خارج شوند. مگر اینکه فروشنده استقرار درونسازمانی (On-premise) را در محدوده قانونی فراهم کند، تاییدیه امنیتی صادر نمیشود.» این ایمیل تنها دو ساعت قبل از جلسه بودجه به دست مدیر مالی رسید.
چاقوی سوم: سقوط در دمو
برای اینکه ضربه نهایی زده شود و معامله کاملاً متوقف گردد، لینا از خودِ سیستم استفاده کرد. وینس یک دموی نهایی ترتیب داده بود تا با حضور بهترین مهندس شرکت DeepCover AI، نگرانیهای مالی و امنیتی را دور بزند. لینا مسئول آمادهسازی محیط دمو بود.
او طبق روال عادی، یک تیکت جیرا (JIRA) ثبت کرد و یک PR فرستاد تا دادههای تست رگرسیون را با سناریوهای تراکنش چندارزی سه ماهه دوم (Q2) بهروزرسانی کند. هیچ کد مخفی در کار نبود؛ او صرفاً پیچیدهترین و بهروزترین دادههای واقعی را وارد کرد. در اتاقی که مدیر مالی، اورت، راج و دو ناظر هیئتمدیره حضور داشتند، اتفاقات زیر رخ داد:
- طعمدار کردن: مهندس فروشنده با مسیرهای ساده (Happy Paths) شروع کرد و پوشش عالی را نشان داد. لینا اشاره کرد که دادههای جدید چندارزی هفته پیش فعال شدهاند و هنوز در مجموعه نیستند.
- زوال: وقتی ابزار روی تراکنشهای واقعی اجرا شد، میزان پوشش از ۹۲٪ به ۸۷٪ و سپس به ۷۴٪ سقوط کرد.
- توهم: کتابخانه الگوها نتوانست ترکیب «نرخ ارز چندمرحلهای + بازپرداخت جزئی + منطقه زمانی متفاوت» را بفهمد. مدل دچار توهم (Hallucination) شد و تراکنش ۱۲,۴۷۰ دلاری را ۷۴۳.۶۰ دلار محاسبه کرد.
- فروپاشی: یکی از تستهای تولید شده باعث ایجاد یک حلقه بینهایت (Infinite Loop) در خطای تسویه شد. در سه دقیقه، سیستم بیش از ۴,۰۰۰ درخواست API ارسال کرد، محیط استیجینگ را کرشاند و تمام داشبوردهای مانیتورینگ را قرمز کرد.
پیامدها و درسهای استراتژیک
بر اساس گزارشهای داخلی، معامله DeepCover AI 완전히 شکست خورد. مدیر مالی بودجه را مسدود کرد، تیم امنیت پرچم قرمز را حفظ کرد و اسکرینشاتهای کرش سیستم در اسلک (Slack) دست به دست شد. وینس دیگر هرگز درباره این موضوع صحبت نکرد، زیرا پذیرش این شکست برای آینده شغلی او بدتر از سکوت بود. اورت نیز به دلیل شناسایی خطای بودجه نزد مدیر مالی اعتبار پیدا کرد و در نهایت با خرید یک قهوه از لینا، از او برای «کار خوبش» تشکر کرد.
این مورد نشان میدهد که در پذیرش هوش مصنوعی در سازمانها، تخصص فنی وقتی به صورت «گزارش ریسک» ارائه شود، اغلب نادیده گرفته میشود، اما وقتی از طریق ترسهای بخش مالی و انطباق منتقل شود، تعیینکننده است. لینا با وینس نجنگید؛ او اجازه داد مدیر مالی، معمار امنیت و شکست خودِ سیستم برای او بجنگند.
برای خواننده، این بدان معناست که موفقیت ابزارهای AI در سازمانها کمتر به «جادوی» مدل زبانی وابسته است و بیشتر به واقعیتهای خستهکنندهای مثل محل ذخیره دادهها، شفافیت بودجه و مدیریت موارد خاص (Edge Cases) بستگی دارد. اگر در حال ارزیابی ابزاری هستید، ارزشمندترین دادهها در مقاله سفید فروشنده نیستند، بلکه در شکافهایی هستند که ابزار نمیتواند یک مورد خاص از الزامات انطباق را برآورده کند.
به این نکته توجه کنید که چگونه شرکتها به سمت «هوش مصنوعی حاکمیتی» (Sovereign AI) و استقرار درونسازمانی حرکت میکنند، زیرا مدل «فقط SaaS» بهطور فزایندهای با قوانین سختگیرانه دادههای مالی در تضاد است. همانطور که لینا دریافت، وقتی نمیتوانید خودتان تغییر ایجاد کنید، باید شخص یا سیستم درستی را پیدا کنید تا این کار را برای شما انجام دهد.
گام بعدی شما
- اگر در حال ارزیابی ابزاری هستید، بهجای تکیه بر White Paper، روی نقاط کور انطباق (Compliance) و هزینههای پنهان استقرار تمرکز کنید.
- برای متقاعد کردن مدیریت ارشد، دادههای فنی را به متغیرهای مالی و ریسکهای قانونی ترجمه کنید.
- همیشه سختترین دادههای واقعی خود را (نه دادههای تمیز آزمایشگاهی) در دموهای نهایی به چالش بکشید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چرا استقرار درونسازمانی در حال بازگشت است، به تحلیل ما درباره هوش مصنوعی حاکمیتی مراجعه کنید.




گفتگو