اگر امروز از GPT-4o یا Claude 3.7 Sonnet استفاده میکنید، باید بدانید که با یک ذهن سخن نمیگویید. شما در واقع با یک موتور احتمالات عظیم تعامل دارید.
به نقل از راهنمای ژوئن ۲۰۲۶ در وبسایت dev.to، این مدلها متن را از طریق پیشبینی محتملترین توکن (Token) — مثل برشهای یک کیک طولانی که مدل تکهتکه میخورد — تولید میکنند. آنها حقایق را بازیابی نمیکنند، بلکه احتمال آماری را محاسبه میکنند.
بسیاری از کاربران با هوش مصنوعی مثل یک جعبه سیاه برخورد میکنند. همین ابهام باعث میشود یک پرامپت واحد، نتایج کاملاً متفاوتی بدهد. همانطور که در تحلیلهای پیشین ما دربارهی مدیریت خطاهای عاملهای هوش مصنوعی اشاره کردیم، درک مکانیسمهای زیرساختی به شما کمک میکند تا توکنها را به عنوان واحد اصلی عملکرد مدل ببینید.
قلب این سیستم، معماری ترنسفورمر (Transformer) است که گوگل در سال ۲۰۱۷ معرفی کرد. این سیستم از یک مکانیسم توجه (Attention Mechanism) — شبیه به هایلایت کردن کلمات کلیدی در یک متن برای درک بهتر مفهوم — استفاده میکند تا ارتباط کلمات را از طریق سه بخش Query (پرسوجو)، Key (کلید) و Value (مقدار) بسنجد.
بر اساس مستندات فنی، آموزش این مدلها در سه مرحله رخ میدهد:
- پیشآموزش (Pre-training): یادگیری الگوهای آماری از تریلیونها کلمه در وب.
- تنظیم دقیق نظارتشده (SFT) — مثل وقتی به یک پزشک عمومی، تخصص پوست میدهیم تا در یک حوزه دقیق شود — برای تبدیل مدل به یک دستیار مفید.
- یادگیری تقویتشده از بازخورد انسانی (RLHF): رتبهبندی پاسخها توسط انسان برای تزریق ایمنی و شخصیت به وزنهای مدل.
مدلهای جدیدی مثل Gemini 2.5 Pro و OpenAI o3 اکنون از زنجیره تفکر (Chain-of-Thought) بهره میبرند. این مدلها — شبیه شاگرد ریاضی که پای تخته بلند بلند فکر میکند تا به جواب برسد — گامهای میانی را تولید میکنند تا استدلال خود را نمایش دهند.
این یعنی کلمات پرامپت شما فقط یک پیشنهاد نیستند، بلکه یک «ماشه آماری» هستند. وقتی یک شخصیت (Persona) خاص تعریف میکنید، توزیع احتمالات داخلی مدل را تغییر میدهید. بنابراین، توهم (Hallucination) — وقتی مدل با اطمینان چیزی میگوید که وجود ندارد، شبیه دوستی که خاطرهای را اشتباه تعریف میکند — یک باگ تصادفی نیست، بلکه محصول ذاتی پیشبینی آماری است.
گام بعدی شما
- وظایف پیچیده را به زنجیرهای از مراحل استدلالی خرد کنید تا دقت مدل بالا رود.
- برای تست اثر تصادفیبودن پاسخها، تنظیمات Temperature را در API شرکت Together AI تغییر دهید.
- از مدل بخواهید قبل از دادن پاسخ نهایی، ابتدا «گامهای تفکر» خود را بنویسد.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک لایهی فیزیکی این محاسبات، به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گفتگو