اگر تصور میکنید تنظیم دمای صفر (Temperature=0) تضمینکنندهی نتایج تکرارپذیر در عاملهای هوش مصنوعی (AI Agents) است، در واقع لایهی بنیادیتری از شکستهای سیستماتیک را نادیده میگیرید. این ناپایداری یک خطای گذرا نیست، بلکه آبشاری از نوسانات است که در چندین لایهی پشتهی نرمافزاری رخ میدهد.
همانطور که در بررسیهای پیشین ما دربارهی توهمات مدلهای زبانی اشاره کردیم، پیشبینیپذیری همواره چالش اصلی بوده است. اکنون با گذار از رابطهای چت ساده به حلقههای پیچیدهی ارکستراسیون (Orchestration)، مفهوم تصادفی بودن (Stochasticity) به بزرگترین گلوگاه اعتماد تبدیل شده است. توسعهدهندگان اکنون با این چالش روبرو هستند که چگونه پروتوتایپهای آزمایشی را به محیطهای تولیدی قابل پیشبینی تبدیل کنند. این پیچیدگی در پیادهسازی عملیاتی، اثرات گستردهای بر مدلهای تجاری این فناوری نیز گذاشته است؛ به طوری که تغییر رویکردهای پرداخت توکنمحور در ابزارهایی مانند گیتهاب کوپایلوت پاسخی مستقیم به نیازهای متفاوتی است که عاملهای هوش مصنوعی در محیط تولید ایجاد میکنند.
بر اساس تحلیل فنی منتشر شده در arxiv.org در ۹ ژوئن ۲۰۲۶ توسط محمد ضیاء حیدری، این تغییرپذیری از دو لایهی مجزا نشأت میگیرد:
- منابع درونی (Intrinsic Sources): مدل بنیادی امتیازاتی را برای توکنهای بعدی محاسبه کرده و با استفاده از یک مولد اعداد شبهتصادفی (Pseudo-random number generator)، نمونهبرداری میکند. حتی یک توکن متفاوت میتواند مسیر اجرای کد یا کوئری جستجو را کاملاً تغییر دهد.
- منابع بیرونی (Extrinsic Sources): این موارد شامل تغییرات محیطی، جریانهای دادهی زنده، جابهجایی در زیرساختهای سرویسدهی، اثرات دستهای (Batch effects) و جزئیات مربوط به دقت عددی (Numerical precision) است.
برای جامعهی فنی، این پژوهش فرضیهی «اجرای قطعی» (Deterministic Execution) را به چالش میکشد. به نقل از این تحلیل، چون نوسانات بیرونی مستقل از نمونهبرداری مدل عمل میکنند، متخصصان باید از خلط مفاهیم «تصادفی بودن توکن» با «نویز زیرساختی» دست بردارند. این تفکیک، رویکرد مهندسان به دیباگ کردن و بنچمارک کردن گردشکارهای عاملمحور (Agentic) را تغییر میدهد.
گام بعدی شما
- رصد انتشار چارچوبهای ارزیابی عاملها که قادر به تفکیک لایههای واگرایی هستند.
- بررسی اینکه آیا شکستهای سیستم شما ناشی از نمونهبرداری مدل است یا اختلالات محیطی.
- بازنگری در استراتژیهای تست با در نظر گرفتن متغیرهای زیرساختی خارج از کنترل مدل.
اما تأثیر سختافزار بر این ناپایداری حتی پیچیدهتر است؛ برای درک نقش دقت عددی در استنتاج مدلهای بزرگ، تحلیل ما دربارهی تراشههای نسل جدید را بخوانید.
گفتگو