تصور کنید سیستمی ساختهاید که در محیط تست عالی عمل میکند، اما به محض ورود کاربران واقعی، پاسخهای عجیب و غریبی میدهد. اگر هنوز تمام تمرکز خود را روی نوشتن پرامپتهای پیچیدهتر گذاشتهاید، احتمالاً در تلهٔ «دموهای AI» گرفتار شدهاید و هرگز به پایداری صنعتی نخواهید رسید. این چالش دقیقاً همان نقطهای است که بسیاری از استارتاپها در آن شکست میخورند، همانطور که در بررسی دلایل توقف رشد اپلیکیشنهای هوش مصنوعی در مقیاس صنعتی مشاهده کردیم.
به نقل از گزارش وبسایت dev.to، تیم مهندسی WhatIsGC در ۲۹ ژوئن ۲۰۲۶ نقشهای را منتشر کرد که در آن فلسفهٔ اصلی این است: «مدل زبانی کوچکترین بخش از کل معماری است». در واقع، پایداری هوش مصنوعی در محیط عملیاتی به کنترل سختگیرانه وابسته است، نه به خلاقیت مدل.
بسیاری از توسعهدهندگان کار را با تنظیم پرامپت (Prompt Tuning) شروع میکنند، اما این مسیر در مقیاس بالا به رفتارهایی پیشبینیناپذیر ختم میشود. همانطور که در تحلیلهای پیشین ما دربارهی امنیت و پایداری مدلهای بازمتن دیدیم، اتکای مطلق به هوش مدل، ریسک توهم را بالا میبرد. برای عبور از این مرحله، استفاده از معماریهای جایگزین برای تبدیل نمونههای اولیه به محصولات واقعی ضروری است تا سیستم از حالت یک «رپِر ساده» خارج شود. WhatIsGC برای حل این مشکل، یک خط لوله (Pipeline) چندلایه طراحی کرده است که استدلال را از قالببندی جدا میکند؛ شبیه به یک خط مونتاژ در کارخانه که اگر یک دستگاه خراب شود، کل محصول فاسد نمیشود چون هر مرحله بازبینی کیفیت مخصوص خود را دارد.
بر اساس مستندات منتشر شده، این معماری فنی بر پنج لایهی مجزا استوار است:
- نرمالسازی ورودی (Input normalization)
- درک زمینه (Context understanding)
- تولید پاسخ/دانش (Knowledge generation)
- اعتبارسنجی خروجی (Output validation)
- قالببندی نهایی (Final formatting)
برای حفظ ثبات، این تیم از خروجیهای مبتنی بر اسکیما (Schema) و حفاظها (Guardrails) استفاده کرد تا پاسخهای مستعد توهم (Hallucination) — یعنی وقتی مدل با اطمینان چیزی میگوید که اصلاً وجود ندارد، شبیه دوستی که خاطرهای را اشتباه تعریف میکند — مسدود شوند. همچنین، تستهای واحد قدیمی را با مجموعههای ارزیابی سناریومحور جایگزین کردند تا هرگونه «انحراف رفتاری» را ردیابی کنند. این سامانه برای خروجیهای نامطمئن از منطق جایگزین (Fallback) و مدیریت کنترلشدهی پنجره زمینه (Context Window) — که مثل میز کاری است که فقط جای چند ورق کاغذ دارد — استفاده میکند تا تأخیر پاسخها پیشبینیپذیر باشد.
این چرخش نشان میدهد که چالش بعدی مهندسی AI، «هوشمندتر کردن» مدلها نیست، بلکه «ثباتبخش کردن» آنهاست. این یعنی اولویت با قراردادهای سختگیرانه برای ورودی و خروجی است، نه امید به اینکه یک پرامپت بهتر، مشکل پایداری را حل کند.
گام بعدی شما
- استک AI خود را برای «شکستهای آبشاری» بررسی کنید؛ جایی که یک پاسخ بد مدل، کل تجربه کاربر را نابود میکند.
- ذهنیت «مهندسی پرامپت» را به «مهندسی سیستم» تغییر دهید و لایههای اعتبارسنجی مستقل بسازید.
- برای خروجیهای مدل، از فرمتهای ساختاریافته (مانند JSON Schema) بهجای متن آزاد استفاده کنید.
این تنها آغاز ماجراست؛ اثر این معماری بر کاهش هزینههای استنتاج را در گزارش بعدی بررسی خواهیم کرد.




گفتگو