باید بدانید که سیستمهای چندعاملی فعلی، هزاران توکن را صرف گفتگوهای بیهوده و تکراری میکنند. تصور کنید یک ارتش از مدلهای زبانی بزرگ را برای حل مسئله به کار بگیرید، اما نیمی از بودجهی محاسباتی شما صرف «سلام و احوالپرسی» یا تبادل اطلاعات تکراری میان عاملها شود.
طبق گزارشی که در ۱۲ مه ۲۰۲۶ در arxiv.org منتشر شد، چارچوب RADAR (Redundancy-Aware Diffusion) پیشنهاد میکند که راز بهینهسازی در این است: توپولوژی ارتباطی نباید یک نقشهی ثابت باشد، بلکه باید یک فرآیند زاینده باشد.
همانطور که در تحلیلهای پیشین ما دربارهی چالشهای استنتاج (Inference) در مدلهای زبانی بزرگ اشاره کردیم، ساختارهای ارتباطی ایستا یا تکمرحلهای، ناکارآمدی شدیدی ایجاد میکنند؛ بهطوری که پرسوجوهای ساده توکنهای بیش از حد مصرف میکنند و وظایف پیچیده استدلالی، عمق ساختاری لازم برای موفقیت را ندارند.
به نقل از مستندات این پژوهش، RADAR طراحی توپولوژی را به یک فرآیند تولید گامبهگام تبدیل میکند. این چارچوب از سازوکارهای زیر بهره میبرد:
- ادغام مدلهای انتشار (Diffusion Model) گرافی گسسته و شرطی برای ساخت شبکه.
- هدایت مدل بر اساس «اندازه مؤثر» گراف برای کاهش فعالانهی افزونگی.
- اعتبارسنجی در ۶ بنچمارک مختلف برای تضمین پایداری.
نتایج نشان میدهد که RADAR بهطور مستمر از مدلهای پایه پیشی میگیرد و در سناریوهای متنوع، دقت بالاتر و مصرف توکن کمتری را به ثبت رسانده است.
این رویکرد، پارادایم را از «طراحی» یک پروتکل ارتباطی به «تولید» پروتکلی تغییر میدهد که با هر پرسوجو سازگار میشود. برای متخصصان این حوزه، این به معنای گذار از سلسلهمراتب سختافزاری عاملها به سمت شبکههای سیال و تطبیقی است. در واقع، کارایی یک گروه از عاملهای هوش مصنوعی، به اندازه خودِ هوش مدل، به این بستگی دارد که «چه کسی با چه کسی صحبت کند».
گام بعدی شما
- بررسی مخزن کد نویسندگان برای تست نرخ کاهش توکن در محیطهای عملیاتی.
- تحلیل مقیاسپذیری این مدل انتشار در گروههای عظیمتر از ۶ بنچمارک تستشده.
- ارزیابی تأثیر توپولوژیهای پویا بر کاهش تأخیر (Latency) در سیستمهای عاملمحور (Agentic).
اما تأثیر این رویکرد بر کاهش هزینههای عملیاتی در مقیاس تجاری، موضوع گزارش بعدی ماست.




گفتگو