«موجودی شما به پایان رسیده است». دریافت این ایمیل غافلگیرکننده از OpenAI برای نویسندهای به نام CodePlato، یک چت روتین را به یک «داستان ترسناک هوش مصنوعی» تبدیل کرد. طبق گزارش این کاربر، یک جهش غیرمنتظره در مصرف توکن (Token) — تکههای کوچکی از متن که مثل برشهای یک کیک طولانی هستند و مدل تکهتکه میخورد — باعث تخلیه فوری اعتبار مالی او در OpenClaw شد. این کاربر با وجود اتصال از طریق OAuth، شاهد افزایش شدید مصرف توکن بود که یا به دلیل یک مکانیسم داخلی در OpenAI یا یک استراتژی جایگزین (fallback) در OpenClaw، مستقیماً از موجودی اعتباری او کسر شد. چنین جهشهای ناگهانی اغلب منجر به واکنشهای ناشی از پانیک میشود؛ واکنشهایی مثل شروع گفتگوهای جدید و متعدد در دیسکورد یا حذف و نصب مجدد کل اپلیکیشن برای متوقف کردن این «رختشویی» مالی.

درک این سازوکار برای هر کسی که از «هارنسها» (Harnesses) استفاده میکند حیاتی است. ابزارهایی مثل OpenClaw، Hermes Agent یا Claude Code در واقع لایهای هستند که پنجرهٔ زمینه (Context Window) — یعنی میزان متنی که مدل همزمان در ذهن نگه میدارد، شبیه به میز کاری که جای چند ورق دارد و نه کل کتابخانه — را مدیریت میکنند. این ابزارها «زمینه» نامرئی را مدیریت میکنند که به مدل میگوید کیست و در یک گفتگو چه اتفاقاتی افتاده است. چون مدلهای زبانی ذاتاً حافظه ندارند، آنها هیچ ایدهای ندارند که شما کی هستید یا پیش از هر بار صحبت کردن، درباره چه چیزی بحث کردهاید. بدون این تغذیه مداوم از اطلاعات زمینه، مدل نمیتواند بهعنوان یک دستیار فعال و مستمر عمل کند.

لایههای زمینه
همانطور که در تحلیلهای پیشین ما دربارهی مدیریت حافظه در عاملهای هوش مصنوعی اشاره کردیم، نبودِ یک استراتژی پاکسازی، منجر به تورم دادهها میشود. به نقل از CodePlato، ابزار OpenClaw از یک ساختار متنی چندلایه برای مدیریت هویت و حافظه استفاده میکند:
- لایه اپلیکیشن (App Layer): هویت کلی و جهانی را ثبت میکند. برای مثال، اگر در ChatGPT بپرسید «تو کی هستی؟»، پاسخ میدهد «ChatGPT»، اما همین پرسش در OpenClaw پاسخ «OpenClaw» را برمیگرداند، حتی زمانی که مدل زیربنایی OpenAI باشد. این لایه فایلهایی شامل AGENTS.md، SOUL.md، USER.md و MEMORY.md را به مدل تزریق میکند.
- لایه جلسه (Session Layer): باعث ایزوله شدن چتهای فعلی میشود. این ویژگی به کاربر اجازه میدهد تا در یک جلسه، هوش مصنوعی در نقش یک «وکیل» باشد و در جلسهای دیگر بهعنوان یک «درمانگر» عمل کند، بدون اینکه این دو نقش با یکدیگر تداخل پیدا کنند.
مشکل فشردهسازی
مشکل زمانی آغاز میشود که این لایهها با طولانی شدن چتها بیش از حد بزرگ شوند و هزینهها جهش کنند. در این حالت، مکانیسم «فشردهسازی زمینه» (Context Compression) برای کاهش فشار فعال میشود. با این حال، کاربران متوجه میشوند که عامل هوشمند بهمرور «کودنتر» شده است. این اتفاق به این دلیل رخ میدهد که در طول فشردهسازی، جزئیات دستورالعملهای اولیه حذف میشوند؛ مدل تنها تکههایی از حافظه را به یاد میآورد اما بخشهای دیگر را گم میکند. حتی پس از این فرآیند، زمینه حاصل میتواند همچنان بسیار حجیم و گرانقیمت باشد.

برای جلوگیری از این شوکهای مالی، کاربران باید از چتهای طولانیمدت به سمت جریان کاری «مبتنی بر مهارت» (Skill-based) حرکت کنند. بسیاری از کاربران بهاشتباه در تلهی تکیه بر یک چت واحد برای کارهای تکراری میافتند — کارهایی مثل ترجمه مستندات یا بازدیدهای برنامهریزی شده از وبسایتها — زیرا بازسازی مجدد زمینه برای آنها دشوار و وقتگیر به نظر میرسد.

جزئیات بهینهسازی
برای ایجاد یک عادت کاری درست و بهینهتر، باید این قوانین قرارگیری دادهها را رعایت کرد:
- تقطیر مهارت (Skill Distillation): هرگاه یک وظیفه بیش از ۳ بار تکرار شد، کل آن فرآیند را در قالب یک «مهارت» دائمی تقطیر و ثبت کنید.
- قفل کردن پرسون (Persona Locking): جزئیات طراحیشده برای شخصیت و ویژگیهای رفتاری پرسونای خود را در فایل
SOUL.mdقرار دهید. - دادههای شخصی: اطلاعات ثابت و دائمی، مانند شماره تلفن یا آدرس، را در
USER.mdثبت کنید تا مجبور نباشید در هر جلسه جدید آنها را تکرار کنید.

پس از تبدیل عادتها به مهارتها، میتوان «بازنشانی زمینه» (Context Reset) را برای پاکسازی کامل صفحه و کاهش مصرف توکن انجام داد:
۱. لایه اپلیکیشن: فایل MEMORY.md و کل پوشه حافظه را پاک کنید. چون دادههای حیاتی اکنون در بخش مهارتها (Skills) قرار دارند، این حافظه معمولاً غیرحیاتی است و حذف آن ایمن است.
۲. لایه جلسه: هرگاه یک پروژه یا وظیفه بزرگ تمام شد، یا اگر یک جلسه بیش از یک هفته به طول انجامید، از دستور /new برای شروع یک چت تازه استفاده کنید.
این نظم نه تنها از کیف پول شما محافظت میکند، بلکه نرخ خطا را بهشدت کاهش میدهد و مانع از آن میشود که مدل دستورالعملها را نادیده بگیرد یا اهداف شما را اشتباه بفهمد. تکرارهای کمتر به معنای بهرهوری مؤثر بالاتر است. برای بهینهسازی بیشتر هزینهها، ارزیابی کنید که آیا جریان کاری فعلی شما به کنترل دستی OpenClaw نیاز دارد یا سادگی خودکار Hermes Agent برای شما کافی است.
گام بعدی شما
- فایلهای
SOUL.mdوUSER.mdخود را بازبینی و اطلاعات تکراری را از چتها به این فایلها منتقل کنید. - هرماهه یا پس از هر پروژه بزرگ، حافظه لایهی اپلیکیشن را بهطور کامل پاکسازی کنید.
- برای کارهای تکراری، از قابلیت تعریف Skill بهجای تکیه بر حافظه کوتاهمدت مدل استفاده کنید.
اما داستان سختافزاری این تحول و نحوه مدیریت KV Cache در مدلهای جدید حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو