اگر هنوز برای اصلاح خطاهای مدلهای زبانی در محیط تولید (Production) به حدس و آزمایش تکیه میکنید، در واقع دارید یک «مالیات پنهان» سنگین میپردازید. تصور کنید کل بعدازظهر سهشنبه خود را صرف بررسی ۵۳ مورد شکست در داشبورد کنید و در نهایت بفهمید اصلاحیهای که اعمال کردید، سه بخش دیگر را خراب کرده است.
به نقل از گزارشی در dev.to که در ۲۸ آوریل ۲۰۲۶ منتشر شد، پروژهی متنباز LangHeal برای خودکارسازی این حلقهی اصلاح طراحی شده است. در حالی که ابزارهایی مانند Langfuse و LangSmith در نمایش «چه چیزی خراب شده» عالی هستند، اما پاسخ به سؤال «چگونه آن را درست کنیم» را به شهود انسانی میسپارند. LangHeal این فرآیند را با پیشنهاد بازنویسیهای دقیق برای پرامپتها، طرحوارههای JSON (JSON Schemas) یا قوانین مسیریابی بر اساس شکستهای واقعی در محیط تولید، متحول میکند.

طبق مستندات این پروژه، سیستم از طریق یک خط لوله پنجمرحلهای سختگیرانه عمل میکند:
- استخراج خطا (Failure Extraction): دریافت ردپاهای (Traces) معیاری که زیر یک حد کیفیت خاص (مثلاً کمتر از ۰.۷) هستند.
- طبقهبندی (Classification): استفاده از یک مدل زبانی بزرگ (Large Language Model - LLM) به عنوان داور برای برچسبگذاری نوع خطا، مانند توهم (Hallucination) یا نقض طرحواره.
- تولید اصلاحیه (Fix Generation): پیشنهاد راهکارهایی با اولویت اثرگذاری کم به زیاد؛ از سختگیرانهتر کردن طرحوارهها تا دستورالعملهای تنظیم دقیق (Fine-tuning).
- تست رگرسیون (Regression Testing): بازپخش هر اصلاحیه روی پنجرهای لغزان از ۵۰ مورد شکست تاریخی برای اطمینان از عدم تخریب اصلاحات قبلی.
- تأیید انسانی (Human Approval): بررسی نهایی توسط مهندس پیش از اعمال تغییرات.
همانطور که در تحلیلهای پیشین ما دربارهی پایداری سیستمهای تولید بازیابیافزا (Retrieval-Augmented Generation - RAG) اشاره کردیم، ثبات در مدلهای پیچیده یک چالش همیشگی است. LangHeal برای جلوگیری از «رانش خاموش» (Silent Drift)، نیازمند یک خط کد در اسکریپتهای استقرار است تا مجموعهی تستهای رگرسیون همواره با نسخهی فعلی مدل همگام بماند.
در مواردی که مهندسی پرامپت (Prompt Engineering) شکست میخورد، این ابزار یک مجموعهدادهی آموزشی تأییدشده توسط انسان برای تنظیم دقیق در پلتفرمهایی مانند OpenAI یا Together AI تولید میکند. این رویکرد تضمین میکند که هیچ خطای خام بدون بازبینی وارد مجموعهی آموزشی نشود.
اما این تنها بخشی از معادله است؛ چالش بعدی، ادغام این اصلاحات خودکار در خطوط لوله CI/CD است که در گزارشهای آتی بررسی خواهیم کرد.
گام بعدی شما
- بررسی مستندات LangHeal برای جایگزینی چرخههای دستی «حدس و بررسی».
- پیادهسازی تستهای رگرسیون برای پرامپتهای حساس در محیط تولید.
- ارزیابی امکان تبدیل خطاهای تکراری به مجموعهدادههای آموزشی برای تنظیم دقیق مدل.




گفتگو