تصور کنید یک عامل (Agent) هوش مصنوعی برای پاسخ به یک سوال سادهی مشتری، ۴۷ بار درخواست API ارسال کند و در نهایت پاسخی غلط بدهد. اگر هنوز مدلهای خود را بر پایهی فراخوانیهای خام API میسازید، در واقع در حال سوزاندن بودجهی توکنهای خود هستید.
برای پایان دادن به این ناکارآمدی، شرکت Airbyte در ۵ مه ۲۰۲۶ از Airbyte Agents پردهبرداری کرد؛ یک لایهی دادهی یکپارچه که روش کشف و تعامل عاملها با دادههای عملیاتی را دگرگون میکند.
به نقل از میشل، همبنیانگذار و مدیرعامل Airbyte در پلتفرمی مانند Hacker News، اکثر پیادهسازیهای پروتکل زمینه مدل (Model Context Protocol یا MCP) تنها پوششهای نازکی روی APIها هستند. این موضوع باعث میشود عاملها با محدودیتهای ابتدایی مانند احراز هویت، صفحهبندی (Pagination) و عدم تطابق طرحواره (Schema) دستوپنجه نرم کنند.
برای حل این بحران، Airbyte مفهومی به نام «مخزن زمینه» (Context Store) را معرفی کرد. این مخزن در واقع یک ایندکس دادهای بهینهشده برای جستوجوی عاملمحور (Agentic) است که از طریق کانکتورهای موجود در این شرکت تغذیه میشود.
همانطور که در تحلیل قبلی ما دربارهی چالشهای تولید بازیابیافزا (RAG) اشاره کردیم، دسترسی سریع به دادههای مرتبط، کلید موفقیت هر سیستم هوشمند است. معماری جدید Airbyte به عاملها اجازه میدهد پیش از شروع فرآیند استدلال، متوجه شوند چه دادهای اهمیت دارد، به جای آنکه در زمان اجرا حدس بزنند کدام نقطه اتصال (Endpoint) را فراخوانی کنند.
بر اساس مستندات منتشر شده، نتایج بنچمارکها در کاهش مصرف توکنها تکاندهنده است:
- Zendesk: کاهش تا ۹۰ درصدی توکنها
- Gong: کاهش تا ۸۰ درصدی توکنها
- Linear: کاهش تا ۷۵ درصدی توکنها
- Salesforce: کاهش تا ۱۶ درصدی توکنها
این رویکرد از «چرخش توکن» (Token Churn) جلوگیری میکند؛ وضعیتی که در آن عامل پس از شکست در اولین تلاش، بارها و بارها سعی میکند با فراخوانیهای پراکنده، زمینه لازم را جمعآوری کند. به این ترتیب، پرسوجوهای پیچیده — مانند یافتن قراردادهای سازمانی با تیکتهای پشتیبانی باز — از یک فرآیند کند و خطاریز به یک بازیابی مستقیم تبدیل میشود.
این چرخش راهبردی نشان میدهد که صنعت از پولینگ (Polling) زنده APIها به سمت لایههای زمینهی پیشایندکسشده حرکت میکند. اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ اثر این تصمیم بر اکوسیستم مدلهای متنباز را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- تحلیل میزان مصرف توکن در حلقههای تکرار (Loops) عاملهای فعلی خود را بررسی کنید.
- تفاوت عملکرد بین MCPهای ساده و لایههای Context Store را در محیط تست بسنجید.
- برای کاهش تأخیر در پاسخدهی، استراتژی ایندکسگذاری پیشدستانه را جایگزین فراخوانیهای لحظهای کنید.




گفتگو