GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

Pi-Memoir: کاهش ۹۹.۹ درصدی هزینه توکن‌های کدنویسی با حافظهٔ پایدار

·۱۵ خرداد ۱۴۰۵۸ دقیقه مطالعه
به دستیار هوش مصنوعی‌ام یاد دادم که به خاطر بسپارد (و ۹۹٪ از مغزش را ذخیره کردم)
به دستیار هوش مصنوعی‌ام یاد دادم که به خاطر بسپارد (و ۹۹٪ از مغزش را ذخیره کردم)
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

انتقال حافظه پروژه از «پنجره متنی» (که در هر پیام پاک می‌شود) به یک فایل محلی پایدار. این یعنی مدل دیگر نیازی ندارد در هر Turn، ساختار پوشه‌ها و فایل‌های پروژه را دوباره کشف کند.

اگر از عامل‌های کدنویسی هوش مصنوعی استفاده می‌کنید، احتمالاً هر ماه هزاران دلار بابت اسکن‌های تکراری فایل‌ها می‌پردازید. باید بدانید که این اتلاف هزینه، نتیجه‌ی یک نقص ساختاری در حافظه‌ی مدل‌ها است.

اکثر مدل‌های زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — به جای حافظه‌ی دائمی، به «پنجره‌های متنی» متکی هستند. همان‌طور که در تحلیل قبلی ما درباره‌ی محدودیت‌های توکن اشاره کردیم، مدل در هر مرحله از گفتگو، مجبور است دوباره پروژه را از صفر شناسایی کند. این یعنی اجرای مداوم دستوراتی مثل ls و grep؛ درست مثل این است که از یک برنامه‌نویس جدید بخواهید برای نوشتن هر تابع، تمام کد پروژه را از اول بخواند.

ابزار Pi-memoir که در ۳۰ آوریل ۲۰۲۶ منتشر شد، این مشکل را هدف قرار داده است. به نقل از توسعه‌دهنده‌ی این ابزار (k1lgor)، این افزونه برای عامل کدنویسی (Coding Agent) pi طراحی شده و با استفاده از دستور harvest یک پایگاه دانش فشرده در قالب یک فایل JSONL می‌سازد.

ویژگی‌های فنی این ابزار عبارت است از:

  • تبدیل READMEها، فایل‌های پکیج و ساختار پوشه‌ها به حافظه‌های تگ‌دار.
  • پشتیبانی از ۱۲۸ پسوند فایل و ذخیره‌ی خلاصه‌ی تا ۲۰۰ فایل.
  • اجبار مدل به استفاده از دستور memo_search پیش از اجرای دستورات bash برای گشت‌وگذار در پروژه.

آموزش حافظه به دستیار هوش مصنوعی و کاهش ۹۹ درصدی مصرف مغز

به گزارش k1lgor، در بنچمارک کامپایلر TypeScript — پروژه‌ای عظیم با ۴۰٬۸۷۷ فایل — هزینه‌ی توکن‌ها از ۳۶ میلیون به تنها ۱۹٬۰۰۰ عدد کاهش یافت.

این تغییر، دانش پروژه را از «کشف گران‌قیمت در زمان اجرا» به یک «جدول جست‌وجوی ارزان» تبدیل می‌کند. برای تیمی با ۱۰ برنامه‌نویس، این یعنی کاهش صورت‌حساب ماهانه API از ۴٬۵۰۰ دلار به ۴۵۰ دلار. جالب اینجاست که Pi-memoir به جای استفاده از پایگاه‌های داده برداری پیچیده، از تطبیق کلمات کلیدی در یک فایل ساده استفاده می‌کند تا سرعت و قابلیت انتقال را فدای پیچیدگی معنایی نکند.

گام بعدی شما

  • اگر از عامل‌های کدنویسی استفاده می‌کنید، این ابزار را از طریق bun نصب کنید.
  • اسکریپت بنچمارک داخلی را اجرا کنید تا میزان صرفه‌جویی در هزینه‌های خود را محاسبه کنید.
  • منتظر به‌روزرسانی‌های آینده برای افزودن گراف دانش جهت ردیابی وابستگی‌های پیچیده بین فایل‌ها باشید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

چرا این موضوع مهم است؟

این ابزار با کاهش چشمگیر هزینه‌های استنتاج (Inference)، دسترسی به عامل‌های کدنویسی پیشرفته را برای تیم‌های کوچک اقتصادی می‌کند. اعتبار این ادعا بر اساس بنچمارک‌های عمومی روی پروژه‌های متن‌باز قابل راستی‌آزمایی است.

تأثیر برای ایران

با توجه به قیمت بالای دلار و هزینه‌ی توکن‌های API، این ابزار برای برنامه‌نویسان ایرانی که با پروژه‌های بزرگ کار می‌کنند، یک ضرورت اقتصادی است تا هزینه‌های ماهانه‌ی خود را تا ۱۰ برابر کاهش دهند.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما نشان می‌دهد که Pi-memoir در واقع یک «بازگشت به سادگی» است. در حالی که صنعت به سمت پایگاه‌های داده برداری پیچیده پیش می‌رود، این ابزار ثابت کرد که برای بسیاری از کاربردهای عملی، یک فایل متنی ساده و جست‌وجوی کلمات کلیدی، به دلیل سرعت بالاتر و هزینه کمتر، کارآمدتر است.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه