تصور کنید عامل هوش مصنوعی شما در محیط عملیاتی شکست بخورد و شما هیچ ایدهای نداشته باشید که کدام فراخوان مدل باعث قطع زنجیره شده است. باید بدانید که تا پیش از این، دیباگ کردن این سیستمها بیشتر شبیه حدس زدن بود تا مهندسی.
Jaeger v2 که در اواخر سال ۲۰۲۴ عرضه شد، سرانجام راهی استاندارد برای دیدن آنچه در دل این «جعبه سیاه» میگذرد فراهم کرد. طبق مستندات رسمی، این پروژه صرفاً یک بهروزرسانی نبود، بلکه یک بازسازی کامل بود؛ Jaeger کل معماری داخلی خود را با چارچوب OpenTelemetry Collector (OTel Collector) جایگزین کرد.
این یکپارچگی معماری باعث حذف استقرار پراکنده اجزای قدیمی (مانند jaeger-agent و jaeger-collector) شده است. به همین دلیل، اکنون ما با یک فایل باینری واحد داریم که از طریق YAML پیکربندی میشود. به نقل از گزارش dev.to، قابلیت نمونهبرداری دم-محور (Tail-based sampling) اکنون به لطف پردازندههای OTel contrib به یک قابلیت درجهیک تبدیل شده است.

دستیابی به این سطح از مشاهدهپذیری از طریق کنوانسیونهای معنایی جدید هوش مصنوعی زاینده (Generative AI) در OpenTelemetry ممکن شده است. این استانداردها نحوه نمایش موارد زیر را تعریف میکنند:
- اسپنهای مدل (Model Spans): ردیابی تکتک فراخوانهای استنتاج (Inference) همراه با تعداد توکنها، نام مدل و تأخیر.
- اسپنهای عامل (Agent Spans): نمایش حلقههای استدلالی سطح بالا و مراحل سازماندهی.
- رویدادها (Events): ثبت ورودیهای پرامپت، پاسخهای نهایی و نتایج استفاده از ابزار.
- متریکها (Metrics): تحلیل توزیع تأخیر، میزان مصرف توکن و نرخ خطا.
همانطور که در تحلیلهای قبلی ما دربارهی چالشهای عملیاتی سیستمهای عاملمحور (Agentic) اشاره کردیم، نبودِ استاندارد برای مشاهدهپذیری بزرگترین مانع برای مقیاسپذیری این ابزارها بود. اکنون پشتیبانی از OpenAI، Anthropic، AWS Bedrock و Azure AI Inference به طور کامل برقرار است. حتی پیشنویسهای جدیدی برای پروتکل کانتکست مدل (Model Context Protocol - MCP) آماده شده تا فراخوانهای ابزار در سرورهای سازگار با MCP نیز به صورت اسپنهای استاندارد دیده شوند. ابزارهایی مانند LangChain و LlamaIndex نیز در حال عرضه ابزارهای سنجش سازگار با OTel هستند.
در ردیابی توزیعشده کلاسیک، ما به دنبال کندترین گام در میکروسرویسها بودیم. اما در دنیای عاملهای هوش مصنوعی، ما باید مسیر یک پرامپت را از مرحله برنامهریزی، فراخوان مدل، اجرای ابزار و تکرارهای احتمالی دنبال کنیم. بدون انتشار کانتکست (Context Propagation)، این مسیر تاریک میماند. با Jaeger v2، تیمها برای اولین بار به دیدی شفاف از مصرف توکن و مسیر استدلال دست یافتهاند.
اما این تنها بخشی از پازل است؛ رقابت میان تامینکنندگان ابزارهای مشاهدهپذیری برای تصاحب داشبوردهای GenAI تازه آغاز شده است.
گام بعدی شما
- بررسی کنوانسیونهای معنایی OTel GenAI برای استانداردسازی لاگهای مدلهای خود.
- مهاجرت از نسخه ۱ به ۲ با استفاده از راهنمای رسمی برای بهرهمندی از معماری تک-باینری.
- تست بکاندهای سازگار با OTLP مانند Grafana Tempo یا Honeycomb برای تحلیل دادههای ردیابی.




گفتگو