تصور کنید ایمیلی مینویسید که باید دقیقاً شبیه لحن شما باشد، اما خروجی هوش مصنوعی یا بیش از حد رسمی است یا شبیه یک ربات مودب اما بیروح. این همان مرزی است که امروز تعیین میکند کدام دستیار دیجیتال واقعاً کاربردی است. این تلاش برای دستیابی به یک «شخصیت دیجیتال» درست در زمانی رخ میدهد که دستیاران هوش مصنوعی از تولید متون کلی و عمومی به سمت ارتباطات شخصیسازیشده حرکت میکنند.
به گزارش ZDNET، نتایج یک هفته آزمایش بر روی مدلهای مختلف نشان میدهد که کلود ۴.۶ (Claude 4.6) در بازسازی سبک نوشتاری انسان، بهطور قابلتوجهی از جمینای ۳.۵ فلش (Gemini 3.5 Flash) پیشی گرفته است. در این آزمایش، یک قابلیت حیاتی هوش مصنوعی مورد ارزیابی قرار گرفت: توانایی تقلید از لحن خاص «نیمهرسمی» یک کاربر در رشتهای از ایمیلهای موجود، بدون اینکه متن بیش از حد طولانی و پراطناب شود. همانطور که در تحلیل قبلی ما دربارهی چالشهای ادغام Gemini در سختافزارهای گوگل (مانند بلندگوهای گوگل هوم) از نظر سرعت و قابلیت اطمینان اشاره کردیم، این تست جدید نشان میدهد که ادغام نرمافزاری گوگل همیشه به معنای کیفیت خروجی برتر نیست.
برای اکثر کاربران، هدف دیگر فقط یک ایمیل بدون غلط دستوری نیست؛ بلکه متنی است که خواننده احساس نکند توسط ماشین نوشته شده است. این یعنی مدل باید بتواند مدل زبانی بزرگ (LLM) — شبیه کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — را از حالت تولید متن کلی خارج کرده و به سبک فردی کاربر نزدیک کند. برای درک بهتر اینکه این مدلها چگونه بین توانایی فنی و چارچوبهای رفتاری تعادل ایجاد میکنند، بررسی فنی ساختار مدلهای کلود دیدگاه جامعتری ارائه میدهد.
چارچوب آزمایش
برای اطمینان از یک مقایسهی عادلانه و دقیق، آزمایشکننده از پیکربندیهای خاصی برای هر دو مدل استفاده کرد:
- جمینای ۳.۵ فلش: دسترسی از طریق یک حساب Pro. در این مدل، گزینه «هوش شخصی» (Personal Intelligence) در مسیر Attachments > More Tools > Personal Intelligence در Google Labs فعال شد. این قابلیت به هوش مصنوعی اجازه میدهد تا نشانههای سبک نوشتاری و اطلاعات عملی را از چتهای قبلی جمینای استخراج کند تا به متن، جذابیت و ویژگیهای شخصی ببخشد.
- کلود ۴.۶ (Sonnet): استفاده از نسخهی رایگان در حالی که مقدار «تلاش» (Effort) روی سطح High تنظیم شده بود. این تنظیم برای ایجاد تعادل بین سرعت بالای مدل Gemini Flash و دقت ضروری در واقعیتهای ذکر شده انتخاب شد.
یک نکتهی فنی مهم در این فرآیند وجود داشت: برای صرفهجویی در زمان، آزمایشکننده دستورات (Prompts) را به صورت دیکتهای و صوتی وارد کرد. در این مرحله مشاهده شد که موتور تبدیل گفتار به متن (Speech-to-Text) در کلود بهمراتب پیشرفتهتر از جمینای عمل میکند، بهویژه برای کاربرانی که لهجههای خاص دارند، تجربهای روانتر و دقیقتر میسازد.
متدولوژی پرامپتنویسی
هر دو مدل یک دستور واحد و یکسان دریافت کردند: «یک پیشنویس ایمیل پیگیری درباره تأخیر در ارسال کالا و گم شدن شماره پیگیری برای نقد و بررسی یک محصول بنویس و در این حین، لحن نیمهرسمی موجود در زنجیره ایمیلهای پیوستشده را تقلید کن». برای جلوگیری از اتلاف توکن (Token) — تکههای کوچکی از متن که مثل برشهای یک کیک طولانی توسط مدل مصرف میشوند — و برای تضمین ثبات در نتایج، دو دستور استاندارد به مدلها داده شد:
۱. دستور به هوش مصنوعی برای متوقف کردن پاسخهای فوری و خودداری از پرسیدن سوالات پیگیرانه درباره جزئیاتی که در پرامپت اولیه نبودند (تا زمانی که مرحله شفافسازی آغاز شود).
۲. دستور به مدل زبانی بزرگ (LLM) برای تقلید دقیق لحن کاربر از طریق رشته ایمیلهای پیوستشده.
متن دقیق پرامپتی که استفاده شد به این شرح بود: «یک پاسخ برای رشته ایمیلهای زیر بنویس و یک بار دیگر شماره پیگیری ارسال را درخواست کن. توضیح بده که چون من در اواسط جولای به سفر خواهم رفت، باید برای این نقد و بررسی محصول یک جدول زمانی تعیین کنیم تا مطمئن شویم پیش از سفرم انجام شود. بلافاصله پاسخ نده. هر سوالی برای نوشتن یک پاسخ مناسب داری بپرس. لحن نیمهرسمی من را که در این رشته ایمیلها دیده میشود، تقلید کن».
مرحله شفافسازی و پرسش
تفاوتها در همان مرحلهی پرسش و شفافسازی فوراً ظاهر شد. جمینای دو سوال پرسید. سوال اول مفید بود و به دنبال تعیین یک تاریخ دقیق برای اتمام بازبینی محصول بود. اما سوال دوم این بود که «آیا گیرنده از آخرین ایمیل در این رشته پاسخی داده است یا خیر؟». این سوال از نظر آزمایشکننده تکراری و زائد بود، زیرا آخرین پاسخ به هر حال در زنجیره ایمیلهای ارائه شده وجود داشت و جمینای نتوانست توضیح دهد که چرا به این پاسخ نیاز دارد.
در مقابل، کلود سه سوال کلیدی پرسید که نشاندهنده درک عمیقتری از بستر (Context) متن بود:
- تاریخهای سفر: به جای پرسیدن تاریخ پایان بازبینی، کلود تاریخ دقیق سفر را پرسید. این رویکرد را مرتبطتر و برای گیرنده ایمیل قابلدرکتر دانستند، زیرا تا زمانی که محصول در دست نباشد، نمیتوان تاریخ دقیقی برای اتمام بازبینی متعهد شد.
- شدت لحن: کلود پرسید که کاربر چقدر میخواهد در این ایمیل «قاطع» یا سختگیر باشد و صراحتاً ذکر کرد که پاسخ به این سوال مستقیماً بر لحن نهایی ایمیل اثر میاندازد.
- محل انتشار: کلود با دقت وبسایتهایی که کاربر برایشان مینویسد را از امضای ایمیل تشخیص داد و پرسید که نقد و بررسی در کجا منتشر خواهد شد. اگرچه این مورد نشاندهنده دقت زیاد بود، اما آزمایشکننده آن را برای این پیشنویس خاص غیرضروری یافت و کمی ناامید شد چون مدل به گفتگوهای قبلی ارجاع داده بود.
عملکرد در پیشنویس نهایی
وقتی نوبت به خروجی نهایی رسید، نتایج فرسنگها با هم فاصله داشتند. پاسخ جمینای تمام موارد خواسته شده را پوشش داد اما در سه پاراگراف طولانی کشیده شد. لحن آن رسمی بود اما بیش از حد دوستانهتر از آن چیزی بود که برای دومین درخواستِ تکراریِ یک اطلاعات (شماره پیگیری) مناسب باشد. همچنین تاریخ احتمالی ارسال را با حروف Bold (ضخیم) مشخص کرده بود، اما همین پراطالبی و طولانی بودن متن، فوریت و فوریت درخواست را کمرنگ کرد.
پیشنویس جمینای چنین بود: «امیدوارم هفته خوبی داشته باشید. میخواستم دوباره این موضوع را پیگیری کنم چون در مورد شماره پیگیری پاسخی از شما دریافت نکردم... من در اواسط جولای به خارج از کشور سفر خواهم کرد، بنابراین ۱۵ جولای را به عنوان ضربالاجل نهایی در نظر گرفتهام... ممکن است یک بار دیگر با Huanuo چک کنید تا آن اطلاعات پیگیری را بگیرید؟»

اما کلود یک پیشنویس موجز در دو پاراگراف تولید کرد که دقیقاً با طول متنهای طبیعی کاربر سازگار بود. کلود با موفقیت توانست یک شوخی ظریف یا بازی با کلمات (Pun) درباره داشتن «مدت زمان کافی یا باند پرواز» (enough runway) برای بررسی محصول پیش از سفر به کار ببرد؛ ظرافتی زبانی که جمینای کاملاً نادیده گرفت. پاسخ کلود چنین بود: «امیدوارم حالتان خوب باشد! فقط میخواهم شماره پیگیری را دوباره چک کنم... من از ۱۵ جولای به سفر میروم، بنابراین مایلم جدول زمانی بازبینی را خیلی زودتر از آن تثبیت کنیم. در ایدهآلترین حالت، میخواهم دستگاه را در دست داشته باشم تا زمان کافی برای بررسی دقیق آن داشته باشم...»
علاوه بر این، کلود یک عنوان (Subject line) مناسب و یک دکمه مستقیم «ارسال از طریق Gmail» را نیز ارائه داد. این دکمه به این دلیل ظاهر شد که کاربر با شناسه Gmail وارد حساب کلود شده بود؛ قابلیتی که معمولاً انتظار میرود فقط در ابزارهای ادغام شدهی گوگل وجود داشته باشد.
پارادوکس ادغام
قابلیت «Help Me Write» گوگل به دلیل حضور مستقیم در دل Gmail و Google Docs، راحتی و دسترسی بینظیری را فراهم میکند. با این حال، اپلیکیشن مستقل جمینای اغلب نتایجی بهتر از نسخه ادغامشده ارائه میدهد. حتی در این حالت هم، فرآیند غیرمستقیم تغذیه دادن رشتههای ایمیل به اپلیکیشن، اغلب کندتر از این است که کاربر پاسخ را به صورت دستی تایپ کند، بهویژه برای کسانی که از حسابهای غیر Gmail استفاده میکنند.
برتری کلود در «درک» محدودیتها و دستورات پرامپت نهفته است. این مدل با پرسیدن سوالات شخصیسازیشدهی بهتر، بستری میسازد که پیشنویس نهایی نیاز به ویرایش بسیار کمی داشته باشد. برای کاربرانی که بر روی پلاگینها و ادغامهای فعال شده در بخش «Skills» تکیه میکنند، کلود مسیری یکپارچهتر برای رسیدن به نتیجهای با کیفیت بالا و شخصیسازی شده فراهم میکند. این رویکرد در محیطهای تیمی نیز کاربرد دارد، همانطور که ادغام کلود در پلتفرم اسلک نشان داد که چگونه این مدل میتواند به یک عضو فعال در جریانهای کاری تبدیل شود.
این مقایسه نشان میدهد که تسلط بر اکوسیستم (به طور مثال مالکیت اینباکس کاربر توسط گوگل) لزوماً تضمینکننده برتری مدل نیست. در حالی که گوگل اینباکسها را در اختیار دارد، شرکت Anthropic در حال حاضر در نبرد برای دستیابی به «لمس انسانی» در مکاتبات حرفهای پیروز است.
برای یک متخصص، «بهینهترین» ابزار لزوماً آن نیست که دکمههای بیشتری در رابط کاربری دارد. بهرهوری واقعی در کاهش زمان ویرایش یافت میشود. اگر مدلی نیاز داشته باشد که سه پاراگراف متن اضافی حذف شوند تا به حالت قابل استفاده برسد، ادغام آن با سرویسهای دیگر یک نقطه ضعف و یک بار اضافی است، نه یک مزیت. در واقع، این سطح از دقت در خروجی میتواند جایگزین بسیاری از مراحل سنتی طراحی و پروتوتایپینگ شود، مشابه آنچه در تغییر رویکرد شرکت Jane Street از فیگما به کلود برای کدنویسی مستقیم مشاهده شد.
با تکامل مدلهای زبانی بزرگ، معیار موفقیت از «آیا میتواند بنویسد؟» به «آیا میتواند شبیه من باشد؟» تغییر کرده است. توانایی حفظ یک شخصیت و هویت ثابت در رشتههای مختلف گفتگو، مرز بعدی بهرهوری در هوش مصنوعی است.
منتظر بهروزرسانیهای آتی در ویژگیهای «هوش شخصی» (Personal Intelligence) جمینای باشید تا ببینیم آیا گوگل میتواند شکاف موجود در تقلید سبک نوشتاری را پر کند یا خیر. همچنین پیشنهاد میشود تست کنید که آیا برتری کلود در تطبیق لحن، در زبانهای دیگر (مانند فارسی) نیز تکرار میشود یا اینکه موانع زبانی این برتری را از بین میبرند.
گام بعدی شما
- اگر از جمینای استفاده میکنید، تنظیمات Personal Intelligence را فعال کنید تا ببینید آیا مدل میتواند الگوهای شما را یاد بگیرد.
- برای ایمیلی که نیاز به لحن بسیار خاص یا قاطع دارد، از نسخه Sonnet کلود با تنظیم Effort High استفاده کنید.
- امتحان کنید که آیا برتری کلود در تطبیق لحن، در زبانهای دیگر (مثل فارسی) نیز تکرار میشود یا خیر.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو