حذف واترمارک تصاویر Gemini با محاسبات ریاضی به جای حدس‌های هوش مصنوعی

تصور کنید ابزاری دارید که نه با حدس زدن، بلکه با دقت یک ماشین‌حساب، لایه‌های اضافی یک تصویر را پاک می‌کند. این اتفاق اکنون برای واترمارک‌های تصاویر گوگل Gemini رخ داده است؛ جایی که حذف نشان لوگو دیگر یک مسئله‌ی تخمینی نیست، بلکه یک مسئله‌ی ریاضی است.

طبق گزارشی که در ۵ ژوئیه ۲۰۲۶ در وب‌سایت dev.to منتشر شد، حذف واترمارک‌های خاص هوش مصنوعی می‌تواند یک فرآیند حسابی باشد، نه مولد. به همین دلیل، ریاضیات قطعی می‌تواند پیکسل‌های اصلی یک تصویر Gemini را بدون «لکه» یا «تاری» (smearing) که در روش‌های ترمیم تصویر (inpainting) رایج است، بازیابی کند.

اکثر کاربران تصور می‌کنند حذف واترمارک ذاتاً «ناقص» یا Lossy است؛ زیرا تصور می‌کنند واترمارک مانند در پوشاندن یک حفره عمل می‌کند و پیکسل‌های زیرین را نابود کرده است. در چنین حالتی، یک مدل هوش مصنوعی باید یک جایگزین محتمل را حدس بزند. این دیدگاه برای عکس‌های معمولی درست است، اما در مورد تصاویر تولید شده توسط Gemini کاربرد ندارد.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، درک درست از لایه‌های زیرین تکنولوژی، کلید شکستن باورهای غلط است. اشتباه اصلی در اینجا این است که فرض کنیم واترمارک یک «پدیده هوش مصنوعی» است. در واقع، واترمارک پس از اتمام تولید تصویر توسط مدل، از طریق فرآیندی استاندارد به نام ترکیب آلفا (Alpha Compositing) — که شبیه لایه‌گذاری در فتوشاپ است تا یک تصویر روی تصویر دیگر قرار بگیرد — اضافه می‌شود. این تکنیکی است که از دهه ۱۹۸۰ در گرافیک استفاده می‌شود.

سازوکار معکوس‌سازی ترکیب آلفا

به نقل از گزارش dev.to، واترمارک با فرمول خاصی ایجاد می‌شود: watermarked = α · logo + (1 − α) · original. چون این یک ترکیب وزنی است و نه جایگزینی کامل، داده‌های پیکسلی اصلی هنوز حضور دارند و فقط با رنگ لوگو مخلوط شده‌اند.

حذف واترمارک با ابزار نامناسب، تخریب‌کننده است — ابزار درست را انتخاب کنید

برای بازیابی تصویر اصلی، فرآیند به سادگی این محاسبه را معکوس می‌کند: original = (watermarked − α · logo) / (1 − α). اگر پیکسل نهایی، رنگ لوگو و مقدار آلفا (شفافیت) مشخص باشد، می‌توان مقدار دقیق پیکسل اصلی را از طریق تفریق و تقسیم ساده به دست آورد.

عبور از مانع «نقشه آلفا»

برای این بازیابی بدون tổnات، دو چالش فنی وجود دارد:

کشف نقشه آلفا: لوگو با مقادیر شفافیت ارسال نمی‌شود. توسعه‌دهندگان برای حل این مشکل، واترمارک را روی یک پس‌زمینه تک‌رنگ قرار داده و تفاوت را محاسبه می‌کنند تا نقشه آلفا ساخته شود.
هسته کدر: وقتی مقدار آلفا دقیقاً ۱ باشد، مخرج کسر صفر می‌شود. در این نقاط بسیار کوچک و کاملاً کدر، داده‌های اصلی واقعاً نابود شده‌اند و قابل بازیابی نیستند.

تضمین دقت و اعتبارسنجی

از آنجایی که تصاویر در قالب ۸ بیت برای هر کانال ذخیره می‌شوند، مقداری از دقت زیر-پیکسلی در گرد کردن اولیه ترکیب از دست می‌رود. با این حال، برای بخش اعظم ناحیه واترمارک، بازیابی در مقایسه با لکه‌های AI تقریباً بی‌نقص است.

برای جلوگیری از تخریب تصاویری که واترمارک ندارند، یک خط لوله (pipeline) مقاوم از سه مرحله اعتبارسنجی استفاده می‌کند:

۱. جست‌وجوی کاتالوگ: بررسی تطابق ابعاد تصویر با اندازه‌های خروجی شناخته‌شده‌ی Gemini.
۲. جست‌وجوی لنگر محلی: اسکن برای یافتن مکان دقیق لوگو در ناحیه مورد انتظار.
۳. اعتبارسنجی نتایج منطقی: اجرای ترکیب معکوس و تأیید اینکه خروجی پیش از اعمال تغییرات، منسجم به نظر می‌رسد.

اجرای محلی در برابر استنتاج مدل

این فرآیند به‌طور کامل در مرورگر و با استفاده از Canvas API و JavaScript اجرا می‌شود. برخلاف روش‌های مبتنی بر مدل انتشار (Diffusion Model) برای ترمیم تصویر، این روش نیازی به آپلود در سرور، صف‌های GPU یا مدل‌های میزبانی‌شده ندارد. کل ابزار تنها از چند صد کیلوبایت کد تشکیل شده است.

این موضوع تفاوت «معکوس کردن یک عملیات شناخته‌شده» را با «اختراع یک عملیات محتمل» روشن می‌کند. در حالی که مدل‌های انتشار برای اشیاء دلخواه یا واترمارک‌های کاملاً کدر ضروری هستند، برای ترکیب‌های قطعی، استفاده از آن‌ها زیاده‌روی است.

برای کسانی که می‌خواهند این روش را پیاده کنند، الگوریتم و کاتالوگ‌های اندازه در پروژه gemini-watermark-remover در گیت‌هاب در دسترس است که نسخه‌ای جاوااسکریپتی از ابزار اصلی Allen Kuo است.

این چرخش در رویکرد ثابت می‌کند که تصور «هوش مصنوعی باید اثر هوش مصنوعی را پاک کند» اغلب یک باور غلط است. وقتی نشانی از ریاضی ساخته شده، با ریاضی پاک می‌شود و ابزارهای حدس زنی مولد را برای این کار خاص منسوخ می‌کند.

گام بعدی شما

اگر برنامه‌نویس هستید، مخزن gemini-watermark-remover را در گیت‌هاب بررسی کنید تا با منطق معکوس‌سازی پیکسلی آشنا شوید.
هنگام ارزیابی ابزارهای حذف واترمارک، بین روش‌های «تولیدی/حدسی» و «حسابی/قطعی» تفاوت قائل شوید.
دقت کنید که این روش تنها برای ترکیب‌های آلفا کار می‌کند و روی واترمارک‌های تخریبی (Destructive) اثر ندارد.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.