اگر در حال توسعهی یک هوش مصنوعی مکالمهمحور هستید، احتمالاً متوجه شدهاید که مدل شما پس از چند هفته استفاده در محیط واقعی، شخصیت خود را میبازد و لحنی خنثی و کسلکننده میگیرد. باید بدانید که این پدیده، که «رانش شخصیت» نام دارد، یک خطای ساده در نوشتن دستورات نیست؛ بلکه یک نقص ساختاری است. این چالش ساختاری شباهت زیادی به ریشهی توهمات مدلها دارد، جایی که طراحی اطلاعات میتواند جایگزینی برای تکیه صرف بر وزنهای مدل باشد.
طبق گزارشی که ۸ ژوئن ۲۰۲۶ در وبسایت dev.to منتشر شد، این مشکل زمانی رخ میدهد که تاریخچهٔ گفتگو افزایش مییابد و مدل تلاش میکند پاسخهای خود را با میانگین گرفتن از تعاملات متناقض گذشته هماهنگ کند. شایان ذکر است که این حجم بالای دادهها در حافظه، علاوه بر تاثیر بر شخصیت، هزینههای استنتاج را نیز بهشدت افزایش میدهد. در واقع، مدل زبانی بزرگ (LLM) — شبیه کتابخانهداری است که میلیاردها صفحه را خوانده و حالا با همان لحن کلی کتابها جواب میدهد — و در نتیجه کمکم هویت خاص خود را در انبوه دادهها گم میکند.
همانطور که در تحلیلهای پیشین ما دربارهی شکست عاملهای هوش مصنوعی در مقیاس واقعی دیدیم، بسیاری از توسعهدهندگان سعی میکنند این مشکل را با نوشتن پرامپتهای سیستمی طولانیتر حل کنند. اما این کار شبیه تلاش برای تعمیر لولهٔ ترکیده با تکه چسب است؛ چون هر چه تاریخچه بیشتر شود، مدل بیشتر به سمت یک پاسخ متوسط و عمومی میرود.
به نقل از هایجون ون (Haijun Wen)، بنیانگذار Light Ark Technologies، راهکار این معضل در ArcOS نهفته است. این موتور AI ترکیبی، هر نوبت گفتگو را به پنج مرحله مجزا تقسیم میکند: ادراک، استراتژی، سازماندهی، تولید و حافظه. ویژگیهای فنی این سیستم عبارتند از:
- استفاده از ۷۵ بلوک تصمیمگیرندهٔ کدنویسیشده (Hard-coded) در مراحل استراتژی و سازماندهی، بهجای دستورات پنهان در پرامپت.
- قرار دادن بلوک «شخصیت» در آخرین بخش از متن ورودی (Context)، تا مدل تولیدکننده نتواند هویت خود را نادیده بگیرد.
- طراحی حافظه دو-زمانی برای تفکیک زمان وقوع یک رویداد از زمان ثبت آن.
این سیستم در حال حاضر روی پردازندههای NVIDIA H200 اجرا میشود و مستقل از مدل است. یعنی شما میتوانید با تغییر یک فایل تنظیمات، مدلهای Gemma، Llama یا Qwen را جایگزین کنید، بدون اینکه نیاز باشد تمام پرامپتها را از نو بنویسید.
این رویکرد، تمرکز توسعهدهندگان را از مهندسی پرامپت (Prompt Engineering) — که در واقع هنر سؤال درست پرسیدن برای گرفتن بهترین جواب از یک مشاور باتجربه است — به «هماهنگسازی AI» (AI Orchestration) تغییر میدهد. با انتقال منطق کنترل به کدهای قطعی، دیگر لازم نیست قمار کنید که آیا مدل از دستور شما پیروی میکند یا نه.
گام بعدی شما
- به جای تکیه بر پرامپتهای طولانی، سعی کنید منطق تصمیمگیری عامل خود را به توابع کدنویسیشده منتقل کنید.
- از ساختار «پیوست شخصیت در انتهای متن» برای جلوگیری از نادیده گرفته شدن دستورات توسط مدل استفاده کنید.
- منتظر انتشار اپلیکیشن native iOS شرکت ArcOS باشید تا اثرات این معماری را در محیط واقعی بسنجید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک نقش پردازشهای لبه در این سیستم، به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گفتگو