تصور کنید بخواهید با یک پرامپت، یک موتور بازیسازی کامل بسازید اما در نهایت با یک صفحه سفید روبرو شوید. این کابوس توسعهدهندهی پروژه Amazing Digital Dentures بود که قصد داشت بهرهوری را به یک ماجراجویی دیجیتالی تبدیل کند.
در دورانی که انتظار داریم عاملهای هوش مصنوعی تمام کارهای پیچیده کدنویسی را بر عهده بگیرند، این تجربه شکاف عمیقی را نشان میدهد. مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — هنوز در تبدیل تکههای کد به یک محصول نرمافزاری قابلاعتماد مشکل دارد. همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، تکیه صرف بر حجم دادهها بدون ساختار منطقی، ریسکهای بزرگی دارد.
به نقل از گزارش منتشر شده در ۷ ژوئن ۲۰۲۶ در پلتفرم Hugging Face، توسعهدهنده این پروژه برای واداشتن مدل Nemotron 30b به نوشتن کدهای کاربردی Three.js چندین روش را آزمود:
- پرامپتهای طولانی نتوانستند بازیهای سالم تولید کنند.
- افزودن «کارتهای مهارت» از گیتهاب باعث پر شدن سریع پنجره متنی (Context Window) — که مثل میز کاری است و جای محدودی دارد — شد.
- استفاده از Codex برای تقطیر مهارتها در یک فایل متنی و سپس بهکارگیری تولید بازیابیافزا (RAG) — شبیه دانشآموزی است که قبل از جواب دادن، اول کتاب را باز میکند — اما نتیجه اغلب صفحاتی سفید و خالی بود.
این شکست نشان میدهد که در کدنویسی «عاملمحور» (Agentic)، مشکل اصلی در «مایل آخر» است. مدلها میتوانند ظاهر کد (Syntax) را تقلید کنند، اما در حفظ انسجام ساختاری برای اجرا شکست میخورند. بنابراین، برای کسبوکارهایی که روی اتوماسیون کامل نرمافزاری شرطبندی کردهاند، RAG به تنهایی راه نجات نیست.
گام بعدی شما
- اگر از RAG برای تولید کد استفاده میکنید، خروجیها را با تستهای واحد (Unit Test) سختگیرانه بررسی کنید.
- به جای اعتماد به یک پرامپت بلند، از متدولوژی شکستن تسکها به قطعات کوچکتر استفاده کنید.
- نسخه فعلی این پروژه را در Hugging Face Space تست کنید تا سقف توانایی تولید یکمرحلهای مدلها را ببینید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گفتگو