مقاله پژوهشی جدیدی از متیو پناروزا، گرافهای استدلالی را معرفی میکند؛ معماری مبتنی بر گراف که سیستمهای بازیابی-افزوده (RAG) را خودبهساز، قطعی و قابل اعتمادتر میسازد. این پژوهش محدودیت بنیادین عوامل هوش مصنوعی مولد فعلی را هدف گرفته است: آنها در هر پرسش از صفر استدلال میکنند و زنجیره تفکر خود را پس از هر اجرا از دست میدهند، که نتایج ناسازگار و واریانس بالا به همراه دارد.
برخلاف مکانیزمهای حافظه پیشین که استراتژیهای مقطر را بر اساس شباهت پرسش بازیابی میکنند، گرافهای استدلالی زنجیره تفکر را بهازای هر مدرک بهصورت یالهای ساختاریافته حفظ میکنند. این امر آنچه را که پژوهشگران «بازخورد محور-مدرک» مینامند فراهم میآورد: وقتی مجموعه кандидат جدیدی ارائه میشود، سیستم همه یالهای ارزیابی ورودی را برای هر مدرک در تمام اجراهای پیشین پیمایش میکند و نشان میدهد آن مورد خاص پیشتر چگونه قضاوت شده است. این رویکرد با گرافهای بازیابی تکمیل میشود که یک برنامهریز خط لوله را تغذیه میکنند تا بهتدریج قیف кандидат را در اجراهای متوالی تنگتر کنند.
سیستم ترکیبی یک حلقه بازخورد خودبهساز تشکیل میدهد که در آن دقت بهصورت نظاممند بهبود مییابد و واریانس سطوح قضاوت کاهش مییابد. نکته حیاتی این است که این روش هیچ بازآموزشی نمیخواهد — مدل پایه ثابت میماند و تمام پیشرفتها از طریق مهندسی بافت با پیمایش گراف حاصل میشود.
پژوهشگران سیستم خود را روی معیارهای MuSiQue و HotpotQA با سه پروتکل تجربی ارزیابی کردند: پروتکل خوشه ترتیبی، شبیهسازی استقرار با استفاده مجدد بالا، و آزمایش قطعیت. در پوشش پروفایل مدرک ۵۰٪+, سیستم خطا را ۴۷ درصد در مقایسه با RAG معمولی روی همان پرسشها کاهش میدهد و رابطه دوز-پاسخ از نظر آماری تأیید شده است (p < ۰.۰۰۰۱). روی پرسشهای چهارگامی چالشبرانگیز، دقت ۱۱ واحد درصد بهبود مییابد (p = ۰.۰۰۰۱).
در تنظیمات با استفاده مجدد بالا، سیستم برتری پارتو را کسب میکند — یعنی همزمان بالاترین دقت، ۴۷ درصد هزینه کمتر و ۴۶ درصد تأخیر کمتر را ارائه میدهد. پروفایلهای مدرک سازگاری قضاوت را ۷ تا ۸ واحد درصد بهبود بخشیدند (p = ۰.۰۰۷، آزمون رتبهای علامتدار ویلکاکسون) و سیستم کامل هر ۱۱ مورد آزمون سخت را در دمای صفر و ۰.۵ به سازگاری کامل رساند (p = ۰.۰۰۴).
پیامدها برای استقرار هوش مصنوعی در سازمانها قابل توجه است. سازمانهایی که پرسشهای تکراری دارند یا در حوزههای تخصصی فعالیت میکنند، میتوانند بدون هزینه و پیچیدگی بازآموزش مدل، بهبودهای اساسی در قابلیت اطمینان مشاهده کنند. ماهیت قطعی سیستم — که ورودیهای یکسان خروجیهای یکسان تولید میکنند — برای کاربردهایی که نیاز به نتایج قابل بازتولید دارند بسیار ارزشمند است.
پژوهشگران نشان دادهاند این رویکرد از طریق شبیهسازی استفاده مجدد بالا برای استقرار تولیدی مناسب است. تکیه روش بر پیمایش گراف بهجای بازآموزش نشان میدهد میتوان آن را روی سیستمهای موجود با سربار حداقلی اعمال کرد و بالقوه دسترسی به دستیارهای هوش مصنوعی قابل اعتمادتر را دموکراتیزه کرد.

گفتگو