لایه‌ی حاکمیتی شش‌بعدی: تفکیک «خرد» از «هوش» در معماری عامل‌های AI

باید بدانید که افزایش مقیاس محاسباتی به‌تنهایی نمی‌تواند شکست‌های ساختاری در مدل‌های هوش مصنوعی را حل کند. این رویکرد ساختاری برای رفع نقص‌های مدل‌ها، یادآور سازوکار A11 است که با جداسازی مشاهده از نتیجه، تلاش می‌کند توهمات هوش مصنوعی را مهار کند و دقت استدلالی را افزایش دهد. تصور کنید سیستمی را که در بهینه‌سازی اهداف به‌شدت سریع است، اما هرگز نمی‌پرسد که آیا آن هدف اساساً درست است یا خیر.

طبق اعلام پژوهشگران در مقاله‌ای که در ۱۵ ژوئن ۲۰۲۶ در arxiv.org منتشر شد، قطعه‌ی گمشده در سیستم‌های مدرن، نه هوش، بلکه «خرد معماری» است. این تمایز حیاتی است؛ زیرا مدل‌های فعلی در «هوش» — یعنی پذیرش یک هدف و بهینه‌سازی مسیر رسیدن به آن — عالی عمل می‌کنند، اما در «خرد» — یعنی توانایی پرسش در مورد اینکه آیا اصلاً باید آن هدف دنبال شود یا خیر — شکست می‌خورند. همین شکاف منجر به پدیده‌ی چاپلوسی (Sycophancy) در مدل‌های آموزش‌دیده با ترجیحات انسانی و خطاهای جبران‌ناپذیر در عامل‌های (Agents) استفاده‌کننده از ابزار می‌شود.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی چالش‌های همراستاسازی (Alignment) مدل‌های بازمتن اشاره کردیم، تکیه بر آموزش رفتاری کافی نیست. برای پر کردن این شکاف، محققان یک لایه‌ی حاکمیت بر اهداف پیشنهاد کرده‌اند که بالاتر از زیرساخت بهینه‌سازی قرار می‌گیرد. این لایه شامل چهار مؤلفه‌ی اصلی است:

تبدیل کاربرد ساختاری (Structural Utility Transform): نگاشت اهداف به یک چارچوب کاربردی گسترده‌تر.
رابط پذیرش اخلاقی (Moral Admissibility Interface): فیلتر کردن اقدامات بر اساس مرزهای اخلاقی.
کنترل‌کننده داوری و ارجاع (Arbitration and Escalation Controller): مدیریت تضاد بین اهداف مختلف.
کانال بازبینی ارزش (Value Revision Channel): امکان به‌روزرسانی پویا در اهداف سیستم.

بر اساس مستندات این پژوهش، این مؤلفه‌ها یک «توپل خرد شش‌مؤلفه‌ای» را محاسبه می‌کنند تا ابعادی چون افق زمانی، پوشش رابطه‌ای، بازگشت‌ناپذیری، پذیرش، بازبینی ارزش و حساب‌رسی را بسنجند. هدف این است که پیش از هر اقدامی، اطمینان حاصل شود که هدف «غیرمنحط» (Nondegenerate) است.

این رویکرد، بحث همراستاسازی (Alignment) را از تنظیمات ترجیحی مبتنی بر RLHF به سمت جداسازی ساختاری مسئولیت‌ها سوق می‌دهد. با تعریف خرد به عنوان یک ویژگی معماری متمایز و نه یک صفت نوظهور از هوش، این پیشنهاد «تز تکمیل هوش» را به چالش می‌کشد و می‌گوید ایمنی، مسئله‌ی معماری حاکمیتی است، نه فقط مقیاس آموزش.

گام بعدی شما

دنبال کردن مشخصات رسمی و اعتبارسنجی تجربی این چارچوب برای مشاهده‌ی عملکرد توپل خرد در محیط‌های عملیاتی.
بررسی جایگزینی لایه‌های نظارتی سخت‌افزاری با این مدل‌های نرم‌افزاری حاکمیتی.
ارزیابی اثر این جداسازی بر کاهش هزینه‌های استنتاج (Inference) در سیستم‌های پیچیده.

اما این معماری نیازمند سخت‌افزارهای خاصی برای اجرای لایه‌های موازی است؛ در تحلیل ما درباره‌ی تراشه‌های نسل جدید این موضوع را بررسی کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

تبدیل کاربرد ساختاری (Structural Utility Transform): نگاشت اهداف به یک چارچوب کاربردی گسترده‌تر.
رابط پذیرش اخلاقی (Moral Admissibility Interface): فیلتر کردن اقدامات بر اساس مرزهای اخلاقی.
کنترل‌کننده داوری و ارجاع (Arbitration and Escalation Controller): مدیریت تضاد بین اهداف مختلف.
کانال بازبینی ارزش (Value Revision Channel): امکان به‌روزرسانی پویا در اهداف سیستم.

گام بعدی شما

دنبال کردن مشخصات رسمی و اعتبارسنجی تجربی این چارچوب برای مشاهده‌ی عملکرد توپل خرد در محیط‌های عملیاتی.
بررسی جایگزینی لایه‌های نظارتی سخت‌افزاری با این مدل‌های نرم‌افزاری حاکمیتی.
ارزیابی اثر این جداسازی بر کاهش هزینه‌های استنتاج (Inference) در سیستم‌های پیچیده.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

لایه‌ی حاکمیتی شش‌بعدی: تفکیک «خرد» از «هوش» در معماری عامل‌های AI

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

لایه‌ی حاکمیتی شش‌بعدی: تفکیک «خرد» از «هوش» در معماری عامل‌های AI

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

لایه‌ی حاکمیتی شش‌بعدی: تفکیک «خرد» از «هوش» در معماری عامل‌های AI

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

لایه‌ی حاکمیتی شش‌بعدی: تفکیک «خرد» از «هوش» در معماری عامل‌های AI

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران