اگر در حال ساخت عاملهای هوش مصنوعی برای کسبوکار خود هستید، بزرگترین اشتباه این است که از خودِ مدل بخواهید درستی پاسخهایش را بسنجد. این تلهی پرهزینهای است که منجر به ایجاد توهم (Hallucination) — شبیه به دوستی که با اطمینان خاطرهای اشتباه را تعریف میکند — و بههمریختگی بودجهها میشود.
بیشتر دموهای سفر با یک «پرامپت غولآسا» کار میکنند که در محاسبات ساده ریاضی شکست میخورد. طبق اعلام توسعهدهنده این پروژه در ۳ مه ۲۰۲۶، قابلیت اطمینان سیستم نیازمند رویکرد «مهندسی سیستم» است، نه فقط نوشتن پرامپتهای بهتر. همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای بازمتن دیدیم، تکیه صرف بر احتمالات در محیطهای عملیاتی خطرناک است.
در این معماری، وظایف بین هفت عامل (Agent) — شبیه به کارمندانی متخصص که هر کدام فقط یک بخش از پروژه را پیش میبرند — تقسیم شده است. اینها شامل تحلیلگر قصد و مکان-یاب هستند که توسط یک هماهنگکننده مرکزی مدیریت میشوند.

برای تضمین کیفیت، سیستم از طرحهای Pydantic استفاده میکند تا قراردادهای سختگیرانهای بین عاملها برقرار کند. این یعنی هر خروجی، مثل خلاصهی سفر، باید فرمت دقیقی داشته باشد تا به مرحله بعد برود.

نوآوری اصلی در «ناظر» (Critic) نهفته است. برخلاف رویکردهای رایج، این ناظر با زبان پایتون و منطق قطعی نوشته شده، نه با یک فراخوانی دیگر از مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد. این ناظر ۵ قانون حیاتی را چک میکند: محدودیت بودجه، ترجیحات کاربر، شلوغ نبودن مکانها، امکانپذیری جغرافیایی و توازن روزانه.

اگر ناظر خطایی پیدا کند، عامل مقصر را شناسایی کرده و دستور اجرای مجدد میدهد. این چرخه حداکثر دو بار تکرار میشود و سپس سیستم از کاربر میخواهد محدودیتهایش را کاهش دهد.

برای افزایش سرعت، عاملهای مربوط به مقصد، اقامت و حملونقل بهصورت موازی اجرا میشوند. توسعهدهنده برای نزدیک کردن هزینهها به صفر، از مدل Gemini Flash استفاده کرده است.

شفافیت سیستم هم از طریق لاگهای JSONL تأمین شده است. بر اساس مستندات پروژه، این کار اجازه میدهد هزینه دقیق هر سفر به دلار و تعداد توکن (Token) — یعنی همان تکههای کوچک متن که مدل میخورد — اندازهگیری شود.

این چرخش نشاندهنده حرکت به سمت «طراحی سیستمهای عاملمحور» است. برای هر کسبوکاری، این یعنی هزینهی کمتر؛ توسعهدهنده گزارش داد که حذف داورِ مبتنی بر LLM، هزینههای سفر را ۳۰٪ کاهش داده است.
گام بعدی شما
- برای جلوگیری از توهمات عددی، بهجای LLM از توابع اعتبارسنجی پایتونی در لایهی Critic استفاده کنید.
- از کتابخانه Pydantic برای تعریف قراردادهای سختگیرانه بین مدلها بهره ببرید.
- برای کاهش هزینه استنتاج، مدلهای کوچکتر و سریعتر (مثل Gemini Flash) را در لایههای موازی قرار دهید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو