تصور کنید عاملی داشته باشید که به جای انباشت بیرویه دادهها، دقیقاً بداند چه زمانی باید «فراموش کند». اگر هنوز فکر میکنید افزایش حافظه مدلها تنها راه حل است، باید با LongSeeker آشنا شوید.
به نقل از مقالهای که در ۷ مئی ۲۰۲۶ در arxiv.org منتشر شد، این عامل جدید با استفاده از رویکرد هوش مصنوعی زاینده (Generative AI)، حافظه کاری خود را نه به عنوان یک توده در حال رشد، بلکه به عنوان یک منبع پویا و انعطافپذیر مدیریت میکند. بر اساس مستندات این پژوهش، مدل LongSeeker توانسته است در بنچمارک BrowseComp-ZH به دقت ۶۲.۵٪ دست یابد؛ عددی که در مقایسه با ۴۶.۷٪ برای Tongyi DeepResearch و ۴۷.۳٪ برای AgentFold، یک جهش خیرهکننده است.
برای رسیدن به این نتیجه، پژوهشگران پارادایم Context-ReAct را معرفی کردند تا مشکل «سرریز بافت» (Context Overflow) در جستجوهای طولانیمدت را حل کنند. در واقع، انباشت سادهی خروجیهای ابزارها باعث سردرگمی عاملها و افزایش توهم (Hallucination) میشود. به همین دلیل، Context-ReAct پنج عملیات کلیدی را برای بازسازی حافظه تعریف کرده است:
- Skip: عبور از گامهای غیرضروری.
- Compress: خلاصهسازی اطلاعات حلشده.
- Rollback: حذف شاخههای استدلالی بیفایده.
- Snippet: حفظ تنها شواهد حیاتی.
- Delete: پاکسازی محتوای تکراری.
همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، مدیریت دقیق دادههای ورودی، کلید پایداری سیستمهای عاملمحور (Agentic) است. LongSeeker که بر پایه مدل Qwen3-30B-A3B و با ۱۰,۰۰۰ مسیر سنتز شده تنظیم دقیق (Fine-tuning) شده است، ثابت کرد که مدیریت هوشمند توجه مدل، بسیار مؤثرتر از افزایش صرفِ پنجره بافت است.
این رویکرد باعث میشود مدل با هر بار پاکسازی مسیر استدلال خود، دقت را بالا برده و هزینههای استنتاج (Inference) را کاهش دهد. اما این تنها بخشی از معماری است؛ تأثیر این رویکرد بر کاهش هزینههای عملیاتی در مقیاس صنعتی را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر در حال توسعه عاملهای جستجو هستید، استراتژی «فشردهسازی پویا» را جایگزین انباشت داده کنید.
- مدلهای خانواده Qwen3 را برای پیادهسازی حافظههای انعطافپذیر بررسی کنید.
- روی متدهای حذف دادههای زائد (Pruning) در زنجیرههای تفکر تمرکز کنید.




گفتگو