چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

تصور کنید عاملی داشته باشید که به جای انباشت بی‌رویه داده‌ها، دقیقاً بداند چه زمانی باید «فراموش کند». اگر هنوز فکر می‌کنید افزایش حافظه مدل‌ها تنها راه حل است، باید با LongSeeker آشنا شوید.

به نقل از مقاله‌ای که در ۷ مئی ۲۰۲۶ در arxiv.org منتشر شد، این عامل جدید با استفاده از رویکرد هوش مصنوعی زاینده (Generative AI)، حافظه کاری خود را نه به عنوان یک توده در حال رشد، بلکه به عنوان یک منبع پویا و انعطاف‌پذیر مدیریت می‌کند. بر اساس مستندات این پژوهش، مدل LongSeeker توانسته است در بنچمارک BrowseComp-ZH به دقت ۶۲.۵٪ دست یابد؛ عددی که در مقایسه با ۴۶.۷٪ برای Tongyi DeepResearch و ۴۷.۳٪ برای AgentFold، یک جهش خیره‌کننده است.

برای رسیدن به این نتیجه، پژوهشگران پارادایم Context-ReAct را معرفی کردند تا مشکل «سرریز بافت» (Context Overflow) در جستجوهای طولانی‌مدت را حل کنند. در واقع، انباشت ساده‌ی خروجی‌های ابزارها باعث سردرگمی عامل‌ها و افزایش توهم (Hallucination) می‌شود. به همین دلیل، Context-ReAct پنج عملیات کلیدی را برای بازسازی حافظه تعریف کرده است:

Skip: عبور از گام‌های غیرضروری.
Compress: خلاصه‌سازی اطلاعات حل‌شده.
Rollback: حذف شاخه‌های استدلالی بی‌فایده.
Snippet: حفظ تنها شواهد حیاتی.
Delete: پاک‌سازی محتوای تکراری.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، مدیریت دقیق داده‌های ورودی، کلید پایداری سیستم‌های عامل‌محور (Agentic) است. LongSeeker که بر پایه مدل Qwen3-30B-A3B و با ۱۰,۰۰۰ مسیر سنتز شده تنظیم دقیق (Fine-tuning) شده است، ثابت کرد که مدیریت هوشمند توجه مدل، بسیار مؤثرتر از افزایش صرفِ پنجره بافت است.

این رویکرد باعث می‌شود مدل با هر بار پاک‌سازی مسیر استدلال خود، دقت را بالا برده و هزینه‌های استنتاج (Inference) را کاهش دهد. اما این تنها بخشی از معماری است؛ تأثیر این رویکرد بر کاهش هزینه‌های عملیاتی در مقیاس صنعتی را در گزارش بعدی بررسی خواهیم کرد.

گام بعدی شما

اگر در حال توسعه عامل‌های جستجو هستید، استراتژی «فشرده‌سازی پویا» را جایگزین انباشت داده کنید.
مدل‌های خانواده Qwen3 را برای پیاده‌سازی حافظه‌های انعطاف‌پذیر بررسی کنید.
روی متدهای حذف داده‌های زائد (Pruning) در زنجیره‌های تفکر تمرکز کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

Skip: عبور از گام‌های غیرضروری.
Compress: خلاصه‌سازی اطلاعات حل‌شده.
Rollback: حذف شاخه‌های استدلالی بی‌فایده.
Snippet: حفظ تنها شواهد حیاتی.
Delete: پاک‌سازی محتوای تکراری.

گام بعدی شما

اگر در حال توسعه عامل‌های جستجو هستید، استراتژی «فشرده‌سازی پویا» را جایگزین انباشت داده کنید.
مدل‌های خانواده Qwen3 را برای پیاده‌سازی حافظه‌های انعطاف‌پذیر بررسی کنید.
روی متدهای حذف داده‌های زائد (Pruning) در زنجیره‌های تفکر تمرکز کنید.

چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران