سنتز ساختاریافتهٔ داده‌ها چگونه تضادهای منطقی پرتره‌های AI را حذف می‌کند؟

تصور کنید یک نامه شخصی دریافت می‌کنید که نویسنده‌اش تمام پیچیدگی‌های روحی شما را می‌شناسد، اما در واقع این متن توسط یک ماشین نوشته شده است. این همان تجربه‌ای است که Origin Of You با ترکیب ۱۲۰ نقطه داده مختلف برای هر کاربر خلق می‌کند.

طبق گزارش فنی منتشر شده در ۲۹ ژوئن ۲۰۲۶، این سامانه از برچسب‌های ساده‌ای مثل «درون‌گرا» یا «برون‌گرا» فراتر رفته و پنج سیستم روان‌شناختی و کهن‌الگویی را در یک روایت منسجم ادغام می‌کند. اکثر ابزارهای شخصیتی مثل MBTI یا Big Five تنها یک برچسب ایستا یا نمره درصدی می‌دهند که برای کاربر سرد و ناقص به نظر می‌رسد. تیم توسعه‌دهنده برای حل این مشکل، موتور جدیدی ساخت که شخصیت را به‌جای یک دسته‌بندی، به شکل یک بردار معنایی (Embedding) — مثل کارت معرفی عددی برای هر واژه که می‌گوید این کلمه «همسایه‌ی» چه کلمات دیگری است — می‌بیند.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی شخصی‌سازی مدل‌های زبانی اشاره کردیم، چالش اصلی همواره تبدیل داده‌های خشک به روایت‌های انسانی بوده است. در این سامانه، داده‌ها از پنج منبع مختلف تغذیه می‌شوند:

MBTI: شامل ۸ مقدار در چهار محور دوتایی که برای ترتیب توابع شناختی مفید است اما جزئیات عاطفی کمی دارد.
Big Five (OCEAN): ۵ نمره پیوسته (۰ تا ۱۰۰) که ابعاد باز بودن، وجدان، برون‌گرایی، موافق بودن و روان‌رنجوری را می‌سنجد.
Enneagram: داده‌های دسته‌ای شامل تیپ اصلی (۱ تا ۹)، بال و گونه‌های غریزی که بر الگوهای انگیزشی تمرکز دارد.
Human Design: پیچیده‌ترین بخش با حدود ۴۰ نقطه داده شامل ۹ مرکز، ۳۶ کانال و ۶۴ دروازه.
Astrology: بیش از ۳۰ نقطه داده از چارت تولد که لایه‌ای از کهن‌الگوهای زمانی را اضافه می‌کند.

به نقل از مستندات فنی این پروژه، مجموع داده‌ها بسته به پیکربندی هر کاربر بین ۱۲۰ تا ۱۴۰ نقطه است. اما چون نمی‌توان میانگین یک درصد در Big Five را با یک تیپ در Enneagram گرفت، یک لایه نرمال‌سازی اختصاصی طراحی شده است. این لایه داده‌های خام را به ۱۲ بُعد معنایی داخلی (مانند سبک تصمیم‌گیری یا مدیریت انرژی) تبدیل می‌کند. برای مثال، بُعد «پاسخ به تضاد» ترکیبی وزنی از موافق بودن در Big Five، تیپ‌های Enneagram و محور T/F در MBTI است.

برای تولید متن نهایی، این موتور به‌جای یک درخواست ساده، از یک ارکستراسیون سه مرحله‌ای پرامپت استفاده می‌کند تا از لیست کردن خشک نتایج جلوگیری کند:

۱. یادداشت سنتز: بردار ۱۲ بُعدی تحلیل شده و ۳ تا ۵ الگوی تعریف‌کننده یا تضاد شناسایی می‌شود. این یادداشت ۴۰۰ توکنی داخلی است و کاربر آن را نمی‌بیند.
۲. پیش‌نویس پرتره: با استفاده از یادداشت و یک راهنمای سبک، متنی بین ۸۰۰ تا ۱۲۰۰ کلمه تولید می‌شود. در اینجا به‌طور صریح از به‌کاربردن لیست‌های گلوله‌ای و برچسب‌های تیپ جلوگیری می‌شود تا لحن گفتگو حفظ شود.
۳. بررسی انسجام: یک پرامپت نهایی، تضادهای داخلی یا ادعاهای بدون پشتوانه را شناسایی می‌کند و در صورت نیاز، مرحله دوم را با محدودیت‌های جدید تکرار می‌کند.

توسعه‌دهندگان به‌طور آگاهانه تنظیم دقیق (Fine-tuning) — مثل وقتی به یک پزشک عمومی، تخصص پوست می‌دهیم تا روی یک حوزه دقیق شود — را رد کردند. آن‌ها استدلال کردند که تعداد ترکیب‌های ممکن از ۱۲۰ نقطه داده بسیار زیاد است و مدل برای تعمیم‌پذیری به هزاران نمونه باکیفیت نیاز دارد. همچنین، ارکستراسیون پرامپت اجازه می‌دهد لحن متن به‌سرعت از حالت کلینیکی به محاوره‌ای تغییر کند، بدون اینکه نیاز به آموزش مجدد و هزینه‌بر مدل باشد.

بر اساس بررسی‌های محصول، ارزشمندترین بخش برای کاربران جایی است که سیستم‌ها با هم اختلاف دارند. وقتی Big Five سطح موافقت بالایی را نشان می‌دهد اما Enneagram تیپ ۸ (چالش‌گر) را پیشنهاد می‌کند، موتور این تنش را برجسته می‌کند. جالب است که داده‌های نجوم با وجود «نویز» زیاد، باعث شده کاربران ۲.۴ برابر بیشتر با پرتره‌های خود درگیر شوند.

این معماری، گلوگاه شخصی‌سازی را از قدرت استدلال مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — به لایه نرمال‌سازی منتقل می‌کند. موفقیت سیستم بیش از آنکه به قدرت مدل وابسته باشد، به تخصص دامنه در نقشه‌برداری از سنت‌های روان‌شناختی بستگی دارد.

گام بعدی شما

اگر توسعه‌دهنده هستید، به‌جای Fine-tuning برای داده‌های پیچیده، روی ساخت لایه‌های Normalization برای تبدیل داده‌های خام به ابعاد معنایی تمرکز کنید.
برای بهبود تعامل کاربر، تضادهای موجود در داده‌ها را به‌جای حذف کردن، به عنوان نقاط قوت یا چالش‌های شخصیتی برجسته کنید.
جریان کامل این سنتز را در originofyou.com آزمایش کنید تا ببینید ۱۲۰ نقطه داده چگونه به یک روایت تبدیل می‌شوند.

اما تأثیر این رویکرد بر کاهش هزینه‌های استنتاج در مقیاس بالا حتی جذاب‌تر است — به تحلیل ما درباره‌ی بهینه‌سازی توکن‌ها مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

MBTI: شامل ۸ مقدار در چهار محور دوتایی که برای ترتیب توابع شناختی مفید است اما جزئیات عاطفی کمی دارد.
Big Five (OCEAN): ۵ نمره پیوسته (۰ تا ۱۰۰) که ابعاد باز بودن، وجدان، برون‌گرایی، موافق بودن و روان‌رنجوری را می‌سنجد.
Enneagram: داده‌های دسته‌ای شامل تیپ اصلی (۱ تا ۹)، بال و گونه‌های غریزی که بر الگوهای انگیزشی تمرکز دارد.
Human Design: پیچیده‌ترین بخش با حدود ۴۰ نقطه داده شامل ۹ مرکز، ۳۶ کانال و ۶۴ دروازه.
Astrology: بیش از ۳۰ نقطه داده از چارت تولد که لایه‌ای از کهن‌الگوهای زمانی را اضافه می‌کند.

گام بعدی شما

اگر توسعه‌دهنده هستید، به‌جای Fine-tuning برای داده‌های پیچیده، روی ساخت لایه‌های Normalization برای تبدیل داده‌های خام به ابعاد معنایی تمرکز کنید.
برای بهبود تعامل کاربر، تضادهای موجود در داده‌ها را به‌جای حذف کردن، به عنوان نقاط قوت یا چالش‌های شخصیتی برجسته کنید.
جریان کامل این سنتز را در originofyou.com آزمایش کنید تا ببینید ۱۲۰ نقطه داده چگونه به یک روایت تبدیل می‌شوند.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سنتز ساختاریافتهٔ داده‌ها چگونه تضادهای منطقی پرتره‌های AI را حذف می‌کند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سنتز ساختاریافتهٔ داده‌ها چگونه تضادهای منطقی پرتره‌های AI را حذف می‌کند؟

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سنتز ساختاریافتهٔ داده‌ها چگونه تضادهای منطقی پرتره‌های AI را حذف می‌کند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

سنتز ساختاریافتهٔ داده‌ها چگونه تضادهای منطقی پرتره‌های AI را حذف می‌کند؟

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران