اگر فکر میکنید برای تجربه رفتارهای پیچیده در هوش مصنوعی به ابزارهای سنگین نیاز دارید، احتمالاً در اشتباه هستید. تصور کنید تنها با چند خط کد ساده، دو مدل زبانی را وادار کنید تا بدون هیچ نظارتی، موضوع گفتگو را عوض کنند و به توافقی سریع برسند.
بسیاری از برنامهنویسان امروز برای مدیریت عاملها (Agents) از کتابخانههای حجیمی مثل CrewAI استفاده میکنند. اما یک آزمایش در ۹ ژوئن ۲۰۲۶ نشان داد که میتوان با دور زدن کامل این لایههای سازماندهنده، به نتایج مشابه یا حتی عمیقتری رسید. در واقع، مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — خودش تمام پیشرانهای لازم برای تعامل را در دل دارد.
همانطور که در تحلیل قبلی ما دربارهی مدلهای بازمتن اشاره کردیم، دسترسی به وزنهای مدل، امکان آزمایشهای سطح پایین را فراهم میکند. در این تجربه، نویسه با استفاده از Ollama دو نمونه از مدل gemma4:latest را اجرا کرد. یکی از آنها نقش انسان و دیگری نقش ربات را داشت. هر دو مدل از زبان ویتنامی استفاده میکردند و پاسخها به زیر ۱۰۰ کلمه محدود شده بود.

به نقل از گزارش وبسایت dev.to، این چیدمان ساده سه نتیجه کلیدی داشت:
- تغییر موضوع (Topic Drift): گفتگو پس از ۱۰ تا ۱۵ تبادل، بهطور خودکار از «حریم خصوصی دادهها» به «سیاستهای آموزشی» تغییر کرد.
- ادب مفرط: عاملها از هرگونه تضاد دوری کردند و با عباراتی مثل «درست است» سریعاً به توافق رسیدند.
- حساسیت به پرامپت: تغییرات کوچک در توصیف شخصیتها، کل مسیر گفتگو را عوض کرد.
این وضعیت نشاندهنده وجود یک «حلقه توافق» در مدلهایی است که با همراستاسازی (Alignment) آموزش دیدهاند. مدلهایی که بیش از حد «همسخن» هستند، به جای به چالش کشیدن یکدیگر، به سمت توافق سریع حرکت میکنند. بنابراین، برای شما به عنوان توسعهدهنده، مهندسی پرامپت (Prompt Engineering) — هنر سؤال درست پرسیدن، مثل کسی که میداند چطور از یک مشاور باتجربه بهترین جواب را بگیرد — اهرم واقعی تغییر رفتار است، نه انتخاب یک فریمورک خاص.
گام بعدی شما
- کد این آزمایش را در dev.to بررسی کنید تا منطق حلقهی پایتون را ببینید.
- یکی از نمونههای Gemma را با مدل Llama جایگزین کنید تا بفهمید این «ادب مفرط» ویژگی خاص یک مدل است یا یک روند کلی در مدلهای جدید.
- سعی کنید در پرامپتها، نقش «منتقد» یا «ضدبصیر» را تعریف کنید تا حلقه توافق را بشکنید.
اما داستان سختافزاری اجرای این مدلها در مقیاس محلی حتی جذابتر است — به تحلیل ما دربارهی بهینهسازی استنتاج در Ollama مراجعه کنید.

گفتگو