عوامل کدنویسی مبتنی بر مدلهای زبانی بزرگ، مخازن کد را بهعنوان متن بدون ساختار behand میکردند. ویرایشها از طریق تطبیق رشتهای اعمال میشدند؛ روشی که در برابر تغییرات قالببندی یا الگوهای مبهم بهشدت آسیبپذیر بود.
تیمی از پژوهشگران چارچوب CODESTRUCT را توسعه دادند. این چارچوب کدبیس را به فضای اقدام ساختاریافته تبدیل میکند. عوامل بهجای کار با بازههای متنی، روی موجودیتهای نامگذاریشده ساختار نحو انتزاعی (AST) (Abstract Syntax Tree) عمل میکنند.
CODESTRUCT دو تابع اصلی معرفی میکند:
- readCode: بازیابی واحدهای نحوی کامل
- editCode: اعمال تبدیلهای اعتبارسنجیشده روی عناصر معنایی برنامه
این جابهجایی از رابطهای متنی به رابطهای ساختارآگاه، بنیان قابلاعتمادتری برای عوامل کدنویسی فراهم میکند.
ارزیابی روی SWE-Bench Verified با شش مدل زبانی مختلف نشان داد: دقت Pass@1 بین ۱.۲ تا ۵.۰ درصد افزایش یافت. مصرف توکن برای اکثر مدلها ۱۲ تا ۳۸ درصد کاهش پیدا کرد. بهبودها بهویژه برای مدلهایی قابلتوجه بود که اغلب در تولید وصلههای معتبر از رابطهای متنی ناکام میماندند.
جیپیتی-۵ نانو (GPT-5-nano) بیشترین پیشرفت را نشان داد. دقت این مدل ۲۰.۸ درصد افزایش یافت. شکستهای وصله خالی از ۴۶.۶ درصد به فقط ۷.۲ درصد سقوط کرد.
آزمایش تکمیلی روی CodeAssistBench دستاوردهای مداوم دقت ۰.۸ تا ۴.۴ درصد را تأیید کرد. کاهش هزینه تا ۳۳ درصد ثبت شد.
این نتایج نشان میدهد رابطهای ساختارآگاه قابلیت اطمینان برتری در مقایسه با رویکردهای سنتی تطبیق رشته برای ویرایش خودکار کد ارائه میدهند.

گفتگو