تصور کنید یک نامه شخصی دریافت میکنید که نویسندهاش تمام پیچیدگیهای روحی شما را میشناسد، اما در واقع این متن توسط یک ماشین نوشته شده است. این همان تجربهای است که Origin Of You با ترکیب ۱۲۰ نقطه داده مختلف برای هر کاربر خلق میکند.
طبق گزارش فنی منتشر شده در ۲۹ ژوئن ۲۰۲۶، این سامانه از برچسبهای سادهای مثل «درونگرا» یا «برونگرا» فراتر رفته و پنج سیستم روانشناختی و کهنالگویی را در یک روایت منسجم ادغام میکند. اکثر ابزارهای شخصیتی مثل MBTI یا Big Five تنها یک برچسب ایستا یا نمره درصدی میدهند که برای کاربر سرد و ناقص به نظر میرسد. تیم توسعهدهنده برای حل این مشکل، موتور جدیدی ساخت که شخصیت را بهجای یک دستهبندی، به شکل یک بردار معنایی (Embedding) — مثل کارت معرفی عددی برای هر واژه که میگوید این کلمه «همسایهی» چه کلمات دیگری است — میبیند.
همانطور که در تحلیلهای قبلی ما دربارهی شخصیسازی مدلهای زبانی اشاره کردیم، چالش اصلی همواره تبدیل دادههای خشک به روایتهای انسانی بوده است. در این سامانه، دادهها از پنج منبع مختلف تغذیه میشوند:
- MBTI: شامل ۸ مقدار در چهار محور دوتایی که برای ترتیب توابع شناختی مفید است اما جزئیات عاطفی کمی دارد.
- Big Five (OCEAN): ۵ نمره پیوسته (۰ تا ۱۰۰) که ابعاد باز بودن، وجدان، برونگرایی، موافق بودن و روانرنجوری را میسنجد.
- Enneagram: دادههای دستهای شامل تیپ اصلی (۱ تا ۹)، بال و گونههای غریزی که بر الگوهای انگیزشی تمرکز دارد.
- Human Design: پیچیدهترین بخش با حدود ۴۰ نقطه داده شامل ۹ مرکز، ۳۶ کانال و ۶۴ دروازه.
- Astrology: بیش از ۳۰ نقطه داده از چارت تولد که لایهای از کهنالگوهای زمانی را اضافه میکند.
به نقل از مستندات فنی این پروژه، مجموع دادهها بسته به پیکربندی هر کاربر بین ۱۲۰ تا ۱۴۰ نقطه است. اما چون نمیتوان میانگین یک درصد در Big Five را با یک تیپ در Enneagram گرفت، یک لایه نرمالسازی اختصاصی طراحی شده است. این لایه دادههای خام را به ۱۲ بُعد معنایی داخلی (مانند سبک تصمیمگیری یا مدیریت انرژی) تبدیل میکند. برای مثال، بُعد «پاسخ به تضاد» ترکیبی وزنی از موافق بودن در Big Five، تیپهای Enneagram و محور T/F در MBTI است.
برای تولید متن نهایی، این موتور بهجای یک درخواست ساده، از یک ارکستراسیون سه مرحلهای پرامپت استفاده میکند تا از لیست کردن خشک نتایج جلوگیری کند:
۱. یادداشت سنتز: بردار ۱۲ بُعدی تحلیل شده و ۳ تا ۵ الگوی تعریفکننده یا تضاد شناسایی میشود. این یادداشت ۴۰۰ توکنی داخلی است و کاربر آن را نمیبیند.
۲. پیشنویس پرتره: با استفاده از یادداشت و یک راهنمای سبک، متنی بین ۸۰۰ تا ۱۲۰۰ کلمه تولید میشود. در اینجا بهطور صریح از بهکاربردن لیستهای گلولهای و برچسبهای تیپ جلوگیری میشود تا لحن گفتگو حفظ شود.
۳. بررسی انسجام: یک پرامپت نهایی، تضادهای داخلی یا ادعاهای بدون پشتوانه را شناسایی میکند و در صورت نیاز، مرحله دوم را با محدودیتهای جدید تکرار میکند.
توسعهدهندگان بهطور آگاهانه تنظیم دقیق (Fine-tuning) — مثل وقتی به یک پزشک عمومی، تخصص پوست میدهیم تا روی یک حوزه دقیق شود — را رد کردند. آنها استدلال کردند که تعداد ترکیبهای ممکن از ۱۲۰ نقطه داده بسیار زیاد است و مدل برای تعمیمپذیری به هزاران نمونه باکیفیت نیاز دارد. همچنین، ارکستراسیون پرامپت اجازه میدهد لحن متن بهسرعت از حالت کلینیکی به محاورهای تغییر کند، بدون اینکه نیاز به آموزش مجدد و هزینهبر مدل باشد.
بر اساس بررسیهای محصول، ارزشمندترین بخش برای کاربران جایی است که سیستمها با هم اختلاف دارند. وقتی Big Five سطح موافقت بالایی را نشان میدهد اما Enneagram تیپ ۸ (چالشگر) را پیشنهاد میکند، موتور این تنش را برجسته میکند. جالب است که دادههای نجوم با وجود «نویز» زیاد، باعث شده کاربران ۲.۴ برابر بیشتر با پرترههای خود درگیر شوند.
این معماری، گلوگاه شخصیسازی را از قدرت استدلال مدل زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — به لایه نرمالسازی منتقل میکند. موفقیت سیستم بیش از آنکه به قدرت مدل وابسته باشد، به تخصص دامنه در نقشهبرداری از سنتهای روانشناختی بستگی دارد.
گام بعدی شما
- اگر توسعهدهنده هستید، بهجای Fine-tuning برای دادههای پیچیده، روی ساخت لایههای Normalization برای تبدیل دادههای خام به ابعاد معنایی تمرکز کنید.
- برای بهبود تعامل کاربر، تضادهای موجود در دادهها را بهجای حذف کردن، به عنوان نقاط قوت یا چالشهای شخصیتی برجسته کنید.
- جریان کامل این سنتز را در originofyou.com آزمایش کنید تا ببینید ۱۲۰ نقطه داده چگونه به یک روایت تبدیل میشوند.
اما تأثیر این رویکرد بر کاهش هزینههای استنتاج در مقیاس بالا حتی جذابتر است — به تحلیل ما دربارهی بهینهسازی توکنها مراجعه کنید.




گفتگو