Claude 4.6 در برابر Gemini 3.5؛ نبرد برای طبیعی‌ترین لحن نوشتاری

تصور کنید ایمیلی می‌نویسید که باید دقیقاً شبیه لحن شما باشد، اما خروجی هوش مصنوعی یا بیش از حد رسمی است یا شبیه یک ربات مودب اما بی‌روح. این همان مرزی است که امروز تعیین می‌کند کدام دستیار دیجیتال واقعاً کاربردی است. این تلاش برای دستیابی به یک «شخصیت دیجیتال» درست در زمانی رخ می‌دهد که دستیاران هوش مصنوعی از تولید متون کلی و عمومی به سمت ارتباطات شخصی‌سازی‌شده حرکت می‌کنند.

به گزارش ZDNET، نتایج یک هفته آزمایش بر روی مدل‌های مختلف نشان می‌دهد که کلود ۴.۶ (Claude 4.6) در بازسازی سبک نوشتاری انسان، به‌طور قابل‌توجهی از جمینای ۳.۵ فلش (Gemini 3.5 Flash) پیشی گرفته است. در این آزمایش، یک قابلیت حیاتی هوش مصنوعی مورد ارزیابی قرار گرفت: توانایی تقلید از لحن خاص «نیمه‌رسمی» یک کاربر در رشته‌ای از ایمیل‌های موجود، بدون اینکه متن بیش از حد طولانی و پراطناب شود. همان‌طور که در تحلیل قبلی ما درباره‌ی چالش‌های ادغام Gemini در سخت‌افزارهای گوگل (مانند بلندگوهای گوگل هوم) از نظر سرعت و قابلیت اطمینان اشاره کردیم، این تست جدید نشان می‌دهد که ادغام نرم‌افزاری گوگل همیشه به معنای کیفیت خروجی برتر نیست.

برای اکثر کاربران، هدف دیگر فقط یک ایمیل بدون غلط دستوری نیست؛ بلکه متنی است که خواننده احساس نکند توسط ماشین نوشته شده است. این یعنی مدل باید بتواند مدل زبانی بزرگ (LLM) — شبیه کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — را از حالت تولید متن کلی خارج کرده و به سبک فردی کاربر نزدیک کند. برای درک بهتر اینکه این مدل‌ها چگونه بین توانایی فنی و چارچوب‌های رفتاری تعادل ایجاد می‌کنند، بررسی فنی ساختار مدل‌های کلود دیدگاه جامع‌تری ارائه می‌دهد.

چارچوب آزمایش

برای اطمینان از یک مقایسه‌ی عادلانه و دقیق، آزمایش‌کننده از پیکربندی‌های خاصی برای هر دو مدل استفاده کرد:

جمینای ۳.۵ فلش: دسترسی از طریق یک حساب Pro. در این مدل، گزینه «هوش شخصی» (Personal Intelligence) در مسیر Attachments > More Tools > Personal Intelligence در Google Labs فعال شد. این قابلیت به هوش مصنوعی اجازه می‌دهد تا نشانه‌های سبک نوشتاری و اطلاعات عملی را از چت‌های قبلی جمینای استخراج کند تا به متن، جذابیت و ویژگی‌های شخصی ببخشد.
کلود ۴.۶ (Sonnet): استفاده از نسخه‌ی رایگان در حالی که مقدار «تلاش» (Effort) روی سطح High تنظیم شده بود. این تنظیم برای ایجاد تعادل بین سرعت بالای مدل Gemini Flash و دقت ضروری در واقعیت‌های ذکر شده انتخاب شد.

یک نکته‌ی فنی مهم در این فرآیند وجود داشت: برای صرفه‌جویی در زمان، آزمایش‌کننده دستورات (Prompts) را به صورت دیکته‌ای و صوتی وارد کرد. در این مرحله مشاهده شد که موتور تبدیل گفتار به متن (Speech-to-Text) در کلود به‌مراتب پیشرفته‌تر از جمینای عمل می‌کند، به‌ویژه برای کاربرانی که لهجه‌های خاص دارند، تجربه‌ای روان‌تر و دقیق‌تر می‌سازد.

متدولوژی پرامپت‌نویسی

هر دو مدل یک دستور واحد و یکسان دریافت کردند: «یک پیش‌نویس ایمیل پیگیری درباره تأخیر در ارسال کالا و گم شدن شماره پیگیری برای نقد و بررسی یک محصول بنویس و در این حین، لحن نیمه‌رسمی موجود در زنجیره ایمیل‌های پیوست‌شده را تقلید کن». برای جلوگیری از اتلاف توکن (Token) — تکه‌های کوچکی از متن که مثل برش‌های یک کیک طولانی توسط مدل مصرف می‌شوند — و برای تضمین ثبات در نتایج، دو دستور استاندارد به مدل‌ها داده شد:

۱. دستور به هوش مصنوعی برای متوقف کردن پاسخ‌های فوری و خودداری از پرسیدن سوالات پیگیرانه درباره جزئیاتی که در پرامپت اولیه نبودند (تا زمانی که مرحله شفاف‌سازی آغاز شود).
۲. دستور به مدل زبانی بزرگ (LLM) برای تقلید دقیق لحن کاربر از طریق رشته ایمیل‌های پیوست‌شده.

متن دقیق پرامپتی که استفاده شد به این شرح بود: «یک پاسخ برای رشته ایمیل‌های زیر بنویس و یک بار دیگر شماره پیگیری ارسال را درخواست کن. توضیح بده که چون من در اواسط جولای به سفر خواهم رفت، باید برای این نقد و بررسی محصول یک جدول زمانی تعیین کنیم تا مطمئن شویم پیش از سفرم انجام شود. بلافاصله پاسخ نده. هر سوالی برای نوشتن یک پاسخ مناسب داری بپرس. لحن نیمه‌رسمی من را که در این رشته ایمیل‌ها دیده می‌شود، تقلید کن».

مرحله شفاف‌سازی و پرسش

تفاوت‌ها در همان مرحله‌ی پرسش و شفاف‌سازی فوراً ظاهر شد. جمینای دو سوال پرسید. سوال اول مفید بود و به دنبال تعیین یک تاریخ دقیق برای اتمام بازبینی محصول بود. اما سوال دوم این بود که «آیا گیرنده از آخرین ایمیل در این رشته پاسخی داده است یا خیر؟». این سوال از نظر آزمایش‌کننده تکراری و زائد بود، زیرا آخرین پاسخ به هر حال در زنجیره ایمیل‌های ارائه شده وجود داشت و جمینای نتوانست توضیح دهد که چرا به این پاسخ نیاز دارد.

در مقابل، کلود سه سوال کلیدی پرسید که نشان‌دهنده درک عمیق‌تری از بستر (Context) متن بود:

تاریخ‌های سفر: به جای پرسیدن تاریخ پایان بازبینی، کلود تاریخ دقیق سفر را پرسید. این رویکرد را مرتبط‌تر و برای گیرنده ایمیل قابل‌درک‌تر دانستند، زیرا تا زمانی که محصول در دست نباشد، نمی‌توان تاریخ دقیقی برای اتمام بازبینی متعهد شد.
شدت لحن: کلود پرسید که کاربر چقدر می‌خواهد در این ایمیل «قاطع» یا سخت‌گیر باشد و صراحتاً ذکر کرد که پاسخ به این سوال مستقیماً بر لحن نهایی ایمیل اثر می‌اندازد.
محل انتشار: کلود با دقت وب‌سایت‌هایی که کاربر برایشان می‌نویسد را از امضای ایمیل تشخیص داد و پرسید که نقد و بررسی در کجا منتشر خواهد شد. اگرچه این مورد نشان‌دهنده دقت زیاد بود، اما آزمایش‌کننده آن را برای این پیش‌نویس خاص غیرضروری یافت و کمی ناامید شد چون مدل به گفتگوهای قبلی ارجاع داده بود.

عملکرد در پیش‌نویس نهایی

وقتی نوبت به خروجی نهایی رسید، نتایج فرسنگ‌ها با هم فاصله داشتند. پاسخ جمینای تمام موارد خواسته شده را پوشش داد اما در سه پاراگراف طولانی کشیده شد. لحن آن رسمی بود اما بیش از حد دوستانه‌تر از آن چیزی بود که برای دومین درخواستِ تکراریِ یک اطلاعات (شماره پیگیری) مناسب باشد. همچنین تاریخ احتمالی ارسال را با حروف Bold (ضخیم) مشخص کرده بود، اما همین پراطالبی و طولانی بودن متن، فوریت و فوریت درخواست را کمرنگ کرد.

پیش‌نویس جمینای چنین بود: «امیدوارم هفته خوبی داشته باشید. می‌خواستم دوباره این موضوع را پیگیری کنم چون در مورد شماره پیگیری پاسخی از شما دریافت نکردم... من در اواسط جولای به خارج از کشور سفر خواهم کرد، بنابراین ۱۵ جولای را به عنوان ضرب‌الاجل نهایی در نظر گرفته‌ام... ممکن است یک بار دیگر با Huanuo چک کنید تا آن اطلاعات پیگیری را بگیرید؟»

تست مقایسه‌ای: جیمینی یا کلود، کدام یک صدای من را تقلید می‌کند؟

اما کلود یک پیش‌نویس موجز در دو پاراگراف تولید کرد که دقیقاً با طول متن‌های طبیعی کاربر سازگار بود. کلود با موفقیت توانست یک شوخی ظریف یا بازی با کلمات (Pun) درباره داشتن «مدت زمان کافی یا باند پرواز» (enough runway) برای بررسی محصول پیش از سفر به کار ببرد؛ ظرافتی زبانی که جمینای کاملاً نادیده گرفت. پاسخ کلود چنین بود: «امیدوارم حالتان خوب باشد! فقط می‌خواهم شماره پیگیری را دوباره چک کنم... من از ۱۵ جولای به سفر می‌روم، بنابراین مایلم جدول زمانی بازبینی را خیلی زودتر از آن تثبیت کنیم. در ایده‌آل‌ترین حالت، می‌خواهم دستگاه را در دست داشته باشم تا زمان کافی برای بررسی دقیق آن داشته باشم...»

علاوه بر این، کلود یک عنوان (Subject line) مناسب و یک دکمه مستقیم «ارسال از طریق Gmail» را نیز ارائه داد. این دکمه به این دلیل ظاهر شد که کاربر با شناسه Gmail وارد حساب کلود شده بود؛ قابلیتی که معمولاً انتظار می‌رود فقط در ابزارهای ادغام شده‌ی گوگل وجود داشته باشد.

پارادوکس ادغام

قابلیت «Help Me Write» گوگل به دلیل حضور مستقیم در دل Gmail و Google Docs، راحتی و دسترسی بی‌نظیری را فراهم می‌کند. با این حال، اپلیکیشن مستقل جمینای اغلب نتایجی بهتر از نسخه ادغام‌شده ارائه می‌دهد. حتی در این حالت هم، فرآیند غیرمستقیم تغذیه دادن رشته‌های ایمیل به اپلیکیشن، اغلب کندتر از این است که کاربر پاسخ را به صورت دستی تایپ کند، به‌ویژه برای کسانی که از حساب‌های غیر Gmail استفاده می‌کنند.

برتری کلود در «درک» محدودیت‌ها و دستورات پرامپت نهفته است. این مدل با پرسیدن سوالات شخصی‌سازی‌شده‌ی بهتر، بستری می‌سازد که پیش‌نویس نهایی نیاز به ویرایش بسیار کمی داشته باشد. برای کاربرانی که بر روی پلاگین‌ها و ادغام‌های فعال شده در بخش «Skills» تکیه می‌کنند، کلود مسیری یکپارچه‌تر برای رسیدن به نتیجه‌ای با کیفیت بالا و شخصی‌سازی شده فراهم می‌کند. این رویکرد در محیط‌های تیمی نیز کاربرد دارد، همان‌طور که ادغام کلود در پلتفرم اسلک نشان داد که چگونه این مدل می‌تواند به یک عضو فعال در جریان‌های کاری تبدیل شود.

این مقایسه نشان می‌دهد که تسلط بر اکوسیستم (به طور مثال مالکیت اینباکس کاربر توسط گوگل) لزوماً تضمین‌کننده برتری مدل نیست. در حالی که گوگل اینباکس‌ها را در اختیار دارد، شرکت Anthropic در حال حاضر در نبرد برای دستیابی به «لمس انسانی» در مکاتبات حرفه‌ای پیروز است.

برای یک متخصص، «بهینه‌ترین» ابزار لزوماً آن نیست که دکمه‌های بیشتری در رابط کاربری دارد. بهره‌وری واقعی در کاهش زمان ویرایش یافت می‌شود. اگر مدلی نیاز داشته باشد که سه پاراگراف متن اضافی حذف شوند تا به حالت قابل استفاده برسد، ادغام آن با سرویس‌های دیگر یک نقطه ضعف و یک بار اضافی است، نه یک مزیت. در واقع، این سطح از دقت در خروجی می‌تواند جایگزین بسیاری از مراحل سنتی طراحی و پروتوتایپینگ شود، مشابه آنچه در تغییر رویکرد شرکت Jane Street از فیگما به کلود برای کدنویسی مستقیم مشاهده شد.

با تکامل مدل‌های زبانی بزرگ، معیار موفقیت از «آیا می‌تواند بنویسد؟» به «آیا می‌تواند شبیه من باشد؟» تغییر کرده است. توانایی حفظ یک شخصیت و هویت ثابت در رشته‌های مختلف گفتگو، مرز بعدی بهره‌وری در هوش مصنوعی است.

منتظر به‌روزرسانی‌های آتی در ویژگی‌های «هوش شخصی» (Personal Intelligence) جمینای باشید تا ببینیم آیا گوگل می‌تواند شکاف موجود در تقلید سبک نوشتاری را پر کند یا خیر. همچنین پیشنهاد می‌شود تست کنید که آیا برتری کلود در تطبیق لحن، در زبان‌های دیگر (مانند فارسی) نیز تکرار می‌شود یا اینکه موانع زبانی این برتری را از بین می‌برند.

گام بعدی شما

اگر از جمینای استفاده می‌کنید، تنظیمات Personal Intelligence را فعال کنید تا ببینید آیا مدل می‌تواند الگوهای شما را یاد بگیرد.
برای ایمیلی که نیاز به لحن بسیار خاص یا قاطع دارد، از نسخه Sonnet کلود با تنظیم Effort High استفاده کنید.
امتحان کنید که آیا برتری کلود در تطبیق لحن، در زبان‌های دیگر (مثل فارسی) نیز تکرار می‌شود یا خیر.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

چارچوب آزمایش

برای اطمینان از یک مقایسه‌ی عادلانه و دقیق، آزمایش‌کننده از پیکربندی‌های خاصی برای هر دو مدل استفاده کرد:

جمینای ۳.۵ فلش: دسترسی از طریق یک حساب Pro. در این مدل، گزینه «هوش شخصی» (Personal Intelligence) در مسیر Attachments > More Tools > Personal Intelligence در Google Labs فعال شد. این قابلیت به هوش مصنوعی اجازه می‌دهد تا نشانه‌های سبک نوشتاری و اطلاعات عملی را از چت‌های قبلی جمینای استخراج کند تا به متن، جذابیت و ویژگی‌های شخصی ببخشد.
کلود ۴.۶ (Sonnet): استفاده از نسخه‌ی رایگان در حالی که مقدار «تلاش» (Effort) روی سطح High تنظیم شده بود. این تنظیم برای ایجاد تعادل بین سرعت بالای مدل Gemini Flash و دقت ضروری در واقعیت‌های ذکر شده انتخاب شد.

متدولوژی پرامپت‌نویسی

مرحله شفاف‌سازی و پرسش

در مقابل، کلود سه سوال کلیدی پرسید که نشان‌دهنده درک عمیق‌تری از بستر (Context) متن بود:

تاریخ‌های سفر: به جای پرسیدن تاریخ پایان بازبینی، کلود تاریخ دقیق سفر را پرسید. این رویکرد را مرتبط‌تر و برای گیرنده ایمیل قابل‌درک‌تر دانستند، زیرا تا زمانی که محصول در دست نباشد، نمی‌توان تاریخ دقیقی برای اتمام بازبینی متعهد شد.
شدت لحن: کلود پرسید که کاربر چقدر می‌خواهد در این ایمیل «قاطع» یا سخت‌گیر باشد و صراحتاً ذکر کرد که پاسخ به این سوال مستقیماً بر لحن نهایی ایمیل اثر می‌اندازد.
محل انتشار: کلود با دقت وب‌سایت‌هایی که کاربر برایشان می‌نویسد را از امضای ایمیل تشخیص داد و پرسید که نقد و بررسی در کجا منتشر خواهد شد. اگرچه این مورد نشان‌دهنده دقت زیاد بود، اما آزمایش‌کننده آن را برای این پیش‌نویس خاص غیرضروری یافت و کمی ناامید شد چون مدل به گفتگوهای قبلی ارجاع داده بود.

عملکرد در پیش‌نویس نهایی

تست مقایسه‌ای: جیمینی یا کلود، کدام یک صدای من را تقلید می‌کند؟

پارادوکس ادغام

گام بعدی شما

اگر از جمینای استفاده می‌کنید، تنظیمات Personal Intelligence را فعال کنید تا ببینید آیا مدل می‌تواند الگوهای شما را یاد بگیرد.
برای ایمیلی که نیاز به لحن بسیار خاص یا قاطع دارد، از نسخه Sonnet کلود با تنظیم Effort High استفاده کنید.
امتحان کنید که آیا برتری کلود در تطبیق لحن، در زبان‌های دیگر (مثل فارسی) نیز تکرار می‌شود یا خیر.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Claude 4.6 در برابر Gemini 3.5؛ نبرد برای طبیعی‌ترین لحن نوشتاری

چارچوب آزمایش

متدولوژی پرامپت‌نویسی

مرحله شفاف‌سازی و پرسش

عملکرد در پیش‌نویس نهایی

پارادوکس ادغام

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Claude 4.6 در برابر Gemini 3.5؛ نبرد برای طبیعی‌ترین لحن نوشتاری

چارچوب آزمایش

متدولوژی پرامپت‌نویسی

مرحله شفاف‌سازی و پرسش

عملکرد در پیش‌نویس نهایی

پارادوکس ادغام

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Claude 4.6 در برابر Gemini 3.5؛ نبرد برای طبیعی‌ترین لحن نوشتاری

چارچوب آزمایش

متدولوژی پرامپت‌نویسی

مرحله شفاف‌سازی و پرسش

عملکرد در پیش‌نویس نهایی

پارادوکس ادغام

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

Claude 4.6 در برابر Gemini 3.5؛ نبرد برای طبیعی‌ترین لحن نوشتاری

چارچوب آزمایش

متدولوژی پرامپت‌نویسی

مرحله شفاف‌سازی و پرسش

عملکرد در پیش‌نویس نهایی

پارادوکس ادغام

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

Z.ai: برتری GLM-5.2 بر GPT-5.5 در کدنویسی بلندمدت

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران