تصور کنید ۱۸۰۰ ساعت از عمر خود را صرف ساخت ابزاری کنید که در نهایت تنها ۲.۹٪ از پتانسیلش استفاده شود. این کابوس یک توسعهدهنده است که دریافت وقتی هوش مصنوعی خودش قدرت تفکر دارد، سیستمهای پیچیده بازیابی داده، تنها یک مانع هستند. در ۲۵ ژوئن ۲۰۲۶، یک مورد پژوهشی مفصل در وبسایت dev.to نشان داد که چگونه تغییر رویکرد از سیستمهای سنگین به پروتکل زمینهٔ مدل (Model Context Protocol یا MCP) توانست سیستمی را که نرخ بهرهوریاش تنها ۲.۹٪ بود، به یک «مغز دوم» بهشدت کاربردی تبدیل کند.
برای سالها، استاندارد طلایی در ساخت پایگاههای دانش مبتنی بر AI، رویکرد «هوش درونی» بود. توسعهدهندگان خطهای لول پیچیدهای را میساختند که شامل درک معنایی، بردار معنایی (Embedding) — که مثل کارت معرفی عددی برای هر واژه است تا همسایگان معناییاش را بشناسد — و الگوریتمهای توصیهگر بود تا تضمین کنند AI دقیقترین تکه از داده را دریافت میکند. این رویکرد بازتابی از وسواس صنعت در استفاده از پشتههای پیچیده RAG (تولید بازیابی-افزا) بود که در آن لایه بازیابی سعی میکرد استدلال مدل زبانی (LLM) را تقلید کند.
این وضعیت دقیقاً شبیه این است که شما بخواهید یک کتاب را برای یک نابغه پیشهضم کنید؛ ساعتها وقت صرف خلاصه کردن و فهرستبندی میکنید، اما در نهایت میبینید آن نابغه میتوانست صفحات خام کتاب را سریعتر و دقیقتر بخواند. همین ناکارآمدی، نتیجهی مهندسی بیشازحد در عصر مدلهای استدلالی قدرتمندی مثل Claude و GPT-4o است. همانطور که در بحثهای گذشتهی ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، اعتماد بیش از حد به لایههای واسطه، همیشه ریسک کاهش دقت را به همراه دارد.
شکست مهندسی بیشازحد
سیستم اولیه این پروژه، یک غول جاوا با بیش از ۲۰۰۰ خط کد بود که از نظر ساختاری بسیار پیچیده شده بود. این سامانه از یک پایگاهداده برداری (Vector Database)، سرویس Embedding و یک موتور توصیه (RecommendationEngine) استفاده میکرد تا نتایج را بر اساس رفتار کاربر فیلتر کند. منطق این سیستم شامل چهار مرحله مجزا بود: تبدیل پرسوجوی کاربر به یک بردار، جستوجوی بردارهای مشابه در دیتابیس، بازرتبهبندی نتایج با استفاده از تحلیل معنایی و در نهایت اعمال فیلترهای مربوط به رفتار کاربر برای پالایش نهایی.
این یک تلاش تمامعیار برای ساخت یک جستوجوی «بهبودیافته با AI» بود. توسعهدهنده باور داشت که برای اثرگذاری یک سیستم دانش، این سیستم باید درک معنایی داخلی خود داشته باشد. این به معنای صرف ماهها زمان برای بهینهسازی الگوریتمهای جستوجو و نوشتن حجم عظیمی از کدهای جاوا برای مدیریت توابعی نظیر SemanticSearch.rerank(matches, query) و recommendationEngine.filterByUserBehavior(items) بود. این تلاش برای تقویت درک معنایی، در حالی است که در حوزههای دیگر، تکنیکهایی برای افزایش تنوع معنایی توسعه یافتهاند تا از تکرار و محدودیتهای مدلها کاسته شود.
اما با وجود این پیچیدگیهای فنی، نتایج بهشدت ناامیدکننده بود. توسعهدهنده آمار زیر را طی یک دوره سه ساله ثبت کرد:
- مجموع زمان توسعه: ۱۸۴۷ ساعت
- تعداد کل مقالات ذخیره شده: ۲۸۴۷ مورد
- تعداد دفعات استفاده واقعی: ۸۴ بار
- نرخ بهرهوری از دانش: ۲.۹٪
- نرخ بازگشت سرمایه (ROI) پروژه: ۹۹.۴- درصد
به نقل از گزارش dev.to، بازگشت سرمایه این سیستم یک فاجعه بود. مشکل اصلی این بود که توسعهدهنده سعی میکرد شغل هوش مصنوعی را انجام دهد. با بهینهسازی جستوجوی معنایی و بازرتبهبندی نتایج پیش از آنکه AI آنها را ببیند، سیستم کندتر شد، هزینهی نگهداریاش بالا رفت و بهطور متناقضی دقتش کمتر از زمانی شد که صرفاً متن خام به مدل داده میشد. نویسنده اشاره میکند که جستوجوی «بهبودیافته با AI» او، در واقع بدتر از این بود که تمام متون مرتبط را در یک پرامپت بریزد و اجازه دهد مدل خودش کار را انجام دهد. این تکرار الگوهای محدود در طراحی، یادآور چالشهایی است که در مورد تولید انبوه محتوای پیشبینیپذیر توسط LLMها بحث شده است.
چرخش به MCP: اولویت داده بر هوشمندی
نقطه عطف داستان، پذیرش پروتکل زمینهٔ مدل (MCP) بود. MCP استانداردی است که به کلاینتهای AI (مثل Claude Desktop یا Cursor) اجازه میدهد ابزارهای سرورهای خارجی را شناسایی و فراخوانی کنند؛ مکانیزمی که شبیه به REST عمل میکند اما اختصاصاً برای عاملهای هوش مصنوعی (AI Agents) طراحی شده است.
درک جدید این بود که هوش مصنوعی نباید «داخل» سیستم دانش زندگی کند، بلکه سیستم دانش باید در دنیای هوش مصنوعی جای بگیرد. در این معماری جدید، هوشمندی از داده جدا میشود. وقتی از یک کلاینت سازگار با MCP استفاده میکنید، خودِ مدل پیشاپیش قادر به اتصال نقاط و ترکیب اطلاعات است. بنابراین سیستم دانش دیگر نیازی به «فهم» یا «درک» پرسوجو ندارد و وظیفهاش فقط «یافتن» متن است. این تغییر رویکرد، مشابه گذار از ساختارهای ایستا به سیستمهای عاملمحور در تولید اسناد است که انعطافپذیری را به جای ساختار سخت جایگزین میکند.
توسعهدهنده آن سرویس ۲۰۰۰ خطی را با یک سرور MCP ۷۰ خطی جایگزین کرد که تنها دو نقطه اتصال (Endpoint) اصلی داشت:
GET /tools/list: این نقطه، ابزارsearch_knowledgeرا تعریف میکند، توصیف آن را مینویسد («جستوجو در پایگاه دانش شخصی برای مقالات و یادداشتها») و پارامتر رشتهای مورد نیاز برای «query» را مشخص میکند.POST /tools/call: این نقطه یک جستوجوی ساده بر اساس تطبیق رشتهها (string-matching) را اجرا کرده و ۵ نتیجه برتر را برمیگرداند.
با این تغییر، جریان منطقی بهطور کلی عوض شد. بهجای اینکه سیستم سعی کند حدس بزند کاربر چه میخواهد، کاربر از کلود میپرسد: «درباره بهینهسازی MCP چه نوشتم؟». در پاسخ، کلود ابزار search_knowledge را با عبارت «MCP optimization» فراخوانی میکند و سرور صرفاً ۵ مقاله برتر را که حاوی این کلمات هستند برمیگرداند. سپس کلود آن مقالات را میخواند، بستر (Context) را درک میکند و پاسخ نهایی را ارائه میدهد.
پیادهسازی فنی سادگی
مکانیزم جدید بهشدت ابتدایی و ساده است. این سیستم از یک SimpleKnowledgeService استفاده میکند که تمام موارد را هنگام استارتآپ از یک پایگاهداده PostgreSQL (جایی که فایلهای markdown ذخیره شدهاند) در حافظه (RAM) بارگذاری میکند. منطق جستوجو از ۲۰۰۰ خط به حدود ۲۰ خط کد کاهش یافت و تنها از یک بررسی .contains() ساده روی نسخهی کوچکشدهی (lowercase) عناوین، محتوا و برچسبها استفاده میکند.
بهطور خاص، متد simpleSearch لیستی از تمام آیتمها را فیلتر میکند تا ببیند آیا عبارت جستوجو در عنوان، متن یا هر یک از تگهای مرتبط وجود دارد یا خیر. این رویکرد «برتفورس» (Brute-force) بسیار سادهتر از خط لول پیچیدهی قبلی شامل Embeddingها و بازرتبهبندیها است.
برای یک پایگاه داده با ۲۸۰۰ مقاله، این روش در یک سرور مجازی (VPS) با ۴ گیگابایت رم، تنها ۵ تا ۱۰ میلیثانیه زمان میبرد. این تغییر منجر به دستاوردهای مالی و عملیاتی فوری شد:
- هزینههای میزبانی: مخارج ماهانه از ۴۵ دلار به ۵ دلار سقوط کرد.
- زیرساخت: حذف کامل نیاز به پایگاهدادههای برداری و تماسهای پولی با APIهای Embedding.
- نگهداری: دیگر نیازی به بازآموزی مدلها با رشد پایگاه دانش نیست.
از نظر پایداری، سیستم قابلاعتمادتر شد چون وابستگی به APIهای خارجی ML و ایندکسهای پیچیده برداری حذف شد. اگر سرور روشن باشد، سیستم کار میکند، فارغ از اینکه OpenAI یا Anthropic دچار اختلال باشند.
دستاوردهای حریم خصوصی و سازگاری
رویکرد MCP علاوه بر عملکرد، یک مشکل حیاتی در حریم خصوصی را هم حل کرد. پیش از این، استفاده از AI برای یادداشتهای شخصی نیازمند آپلود کل مخزن داده در کلاود بود که برای یادداشتهای شخصی، ایدههای پروژهها و افکار پراکنده، بسیار مخاطرهآمیز بود. اما با سرور MCP، دادهها در سرور شخصی توسعهدهنده میمانند و مزایای حریم خصوصی شامل موارد زیر است:
- دسترسی جزئی (Granular): فقط تکههای متنی خاصی که با پرسوجوی فعلی مرتبط هستند به AI ارسال میشوند.
- عدم افشای کلی: مدل هرگز کل پایگاه دانش را بهصورت یکجا نمیبیند.
- کنترل کاربر: توسعهدهنده کنترل کامل دارد که چه کسی به دادهها دسترسی داشته باشد.
همچنین چون MCP یک استاندارد است، این سرور بدون نیاز به کدنویسی مجدد یا سیستمهای احراز هویت متفاوت برای هر ابزار، با هر کلاینت سازگار (از جمله Claude Desktop، Cursor و OpenAI GPTs) کار میکند و کابوس نگهداری برای هر کلاینت جدید را از بین میبرد.
موازنههای روش ساده
البته این رویکرد «ساده» محدودیتهای خاصی دارد که کاربران باید در نظر بگیرند:
- دقت تطبیق: جستوجوی متنی ساده به انعطافپذیری جستوجوی معنایی نیست. اگر کاربر «MCP» را جستوجو کند اما در مقاله فقط عبارت «model context protocols» نوشته شده باشد، سیستم اتفاقاً آن را نمییابد (مگر اینکه تگها استفاده شده باشند). با این حال، نویسنده میگوید در عمل این موضوع بهندرت مشکلساز است؛ اگر جستوجویی شکست خورد، بهسادگی با کلمات دیگر جستوجو میکنید.
- محدودیت حافظه: بارگذاری تمام دادهها در RAM تنها برای پایگاههای کوچک تا متوسط جواب میدهد. در حالی که ۲ تا ۱۰ هزار مقاله بهراحتی در ۱ گیگابایت رم جا میشوند، کتابخانهای با ۱۰۰ هزار آیتم به استراتژی متفاوتی نیاز دارد.
- بلوغ اکوسیستم: MCP هنوز جوان است و ممکن است تغییر کند و هنوز هر کلاینت AI از آن پشتیبانی نمیکند. برای محیطهای عملیاتی با ریسک بالا، شاید صبر برای یک سال جهت پایداری بیشتر عقلانی باشد، اما برای پروژههای شخصی اکنون کاملاً کاربردی است.
- نیاز به میزبانی: برای کار با کلاینتهای ابری، سرور MCP باید بهصورت عمومی در دسترس باشد که این به معنای داشتن یک قطعه زیرساخت برای نگهداری است (توسعهدهنده از یک VPS ارزان استفاده میکند).
- محدودیت پنجره متنی (Context): نتایج جستوجوی طولانی ممکن است پرامپت AI را قطع کنند. توسعهدهنده برای حل این مشکل، مقالات را در پاسخ API به ۲۰۰۰ کاراکتر محدود کرد. اگر AI به متن بیشتری نیاز داشته باشد، میتواند بهطور صریح نسخه کامل مقاله را درخواست کند.
تحلیل نتایج
این گذار، پروژهای را که عملاً مرده بود، دوباره زنده کرد. نویسنده اشاره میکند که پیشتر هر چند ماه یکبار سیستم را باز میکرد تا مقالهای بنویسد، اما اکنون کلود بهطور خودکار هنگام بحث درباره پروژههای قبلی، از این پایگاه دانش استفاده میکند. سیستم از یک محصول شکستخورده به یک «مغز دوم» تبدیل شده که واقعاً یادش میماند چه اتفاقاتی افتاده است.
این تجربه ثابت میکند که در عصر AI عاملمحور، هدف یک پایگاه دانش «هوشمند بودن» نیست، بلکه «یافتنی بودن» است. هوش مصنوعی موتور استدلال است و سرور صرفاً یک کتابدار. وقتی کتابدار دست از تفسیر درخواست بردارد و فقط کتاب را تحویل دهد، سیستم واقعاً کار میکند.
بسیاری از بدهیهای فنی فعلی در حوزه تولید بازیابی-افزا (RAG) و جستوجوی برداری را میتوان نه با الگوریتمهای بهتر، بلکه با حذف کدها و تکیه بر توان استدلالی ذاتی مدلها حل کرد. سیستمهای ساده عمر طولانیتری دارند؛ در حالی که غول ۲۰۰۰ خطی جستوجوی معنایی منسوخ شد، سرور ۷۰ خطی MCP بهدلیل تکیه بر یک پروتکل استاندارد، برای سالها کاربردی خواهد بود.
نحوه پیادهسازی این رویکرد
برای کسانی که پایگاه دانش غیرفعالی دارند، مسیر رستاخیز ساده است: دو نقطه اتصال الزامی MCP را پیادهسازی کنید، آنها را با احراز هویت ایمن کنید و اجازه دهید AI ترکیب اطلاعات را انجام دهد. نویسنده یک چکلیست حداقلی برای پیادهسازی ارائه میدهد:
- پیادهسازی
GET /mcp/tools/listبا متادیتای ابزار (نام، توصیف و پارامترهای مورد نیاز). - پیادهسازی
POST /mcp/tools/callبرای اجرای منطق ابزار و بازگرداندن نتایج. - افزودن احراز هویت (Authentication) برای جلوگیری از دسترسیهای غیرمجاز (که برای دادههای شخصی حیاتی است).
- پیکربندی کلاینت MCP برای اشاره به URL سرور.
برای علاقهمندان به کد، این پیادهسازی در آدرس https://github.com/kevinten10/Papers بهصورت متنباز منتشر شده است. فلسفه اصلی این است که ساده نگه دارید و در مسیر پیش بروید. آینده مدیریت دانش شخصی یک اپلیکیشن بهتر نیست، بلکه یک پروتکل بهتر است که اجازه دهد AI کاری را که در آن بهترین است انجام دهد: فکر کردن.
گام بعدی شما
- اگر پایگاه دانش غیرفعالی دارید، دو نقطه اتصال الزامی MCP (
listوcall) را پیادهسازی کنید. - برای امنیت دادههای شخصی، حتماً لایهی احراز هویت (Authentication) را به سرور خود اضافه کنید.
- کلاینت AI خود را به URL سرور متصل کرده و تفاوت در سرعت بازیابی را تجربه کنید.
اما تاثیر این سادگی بر هزینههای مقیاسپذیر در محیطهای سازمانی حتی تکاندهندهتر است — به تحلیل ما دربارهی بهینهسازی هزینه استنتاج در مدلهای بازمتن مراجعه کنید.




گفتگو