تصور کنید ابزاری دارید که نه با حدس زدن، بلکه با دقت یک ماشینحساب، لایههای اضافی یک تصویر را پاک میکند. این اتفاق اکنون برای واترمارکهای تصاویر گوگل Gemini رخ داده است؛ جایی که حذف نشان لوگو دیگر یک مسئلهی تخمینی نیست، بلکه یک مسئلهی ریاضی است.
طبق گزارشی که در ۵ ژوئیه ۲۰۲۶ در وبسایت dev.to منتشر شد، حذف واترمارکهای خاص هوش مصنوعی میتواند یک فرآیند حسابی باشد، نه مولد. به همین دلیل، ریاضیات قطعی میتواند پیکسلهای اصلی یک تصویر Gemini را بدون «لکه» یا «تاری» (smearing) که در روشهای ترمیم تصویر (inpainting) رایج است، بازیابی کند.
اکثر کاربران تصور میکنند حذف واترمارک ذاتاً «ناقص» یا Lossy است؛ زیرا تصور میکنند واترمارک مانند در پوشاندن یک حفره عمل میکند و پیکسلهای زیرین را نابود کرده است. در چنین حالتی، یک مدل هوش مصنوعی باید یک جایگزین محتمل را حدس بزند. این دیدگاه برای عکسهای معمولی درست است، اما در مورد تصاویر تولید شده توسط Gemini کاربرد ندارد.
همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، درک درست از لایههای زیرین تکنولوژی، کلید شکستن باورهای غلط است. اشتباه اصلی در اینجا این است که فرض کنیم واترمارک یک «پدیده هوش مصنوعی» است. در واقع، واترمارک پس از اتمام تولید تصویر توسط مدل، از طریق فرآیندی استاندارد به نام ترکیب آلفا (Alpha Compositing) — که شبیه لایهگذاری در فتوشاپ است تا یک تصویر روی تصویر دیگر قرار بگیرد — اضافه میشود. این تکنیکی است که از دهه ۱۹۸۰ در گرافیک استفاده میشود.
سازوکار معکوسسازی ترکیب آلفا
به نقل از گزارش dev.to، واترمارک با فرمول خاصی ایجاد میشود: watermarked = α · logo + (1 − α) · original. چون این یک ترکیب وزنی است و نه جایگزینی کامل، دادههای پیکسلی اصلی هنوز حضور دارند و فقط با رنگ لوگو مخلوط شدهاند.

برای بازیابی تصویر اصلی، فرآیند به سادگی این محاسبه را معکوس میکند: original = (watermarked − α · logo) / (1 − α). اگر پیکسل نهایی، رنگ لوگو و مقدار آلفا (شفافیت) مشخص باشد، میتوان مقدار دقیق پیکسل اصلی را از طریق تفریق و تقسیم ساده به دست آورد.
عبور از مانع «نقشه آلفا»
برای این بازیابی بدون tổnات، دو چالش فنی وجود دارد:
- کشف نقشه آلفا: لوگو با مقادیر شفافیت ارسال نمیشود. توسعهدهندگان برای حل این مشکل، واترمارک را روی یک پسزمینه تکرنگ قرار داده و تفاوت را محاسبه میکنند تا نقشه آلفا ساخته شود.
- هسته کدر: وقتی مقدار آلفا دقیقاً ۱ باشد، مخرج کسر صفر میشود. در این نقاط بسیار کوچک و کاملاً کدر، دادههای اصلی واقعاً نابود شدهاند و قابل بازیابی نیستند.
تضمین دقت و اعتبارسنجی
از آنجایی که تصاویر در قالب ۸ بیت برای هر کانال ذخیره میشوند، مقداری از دقت زیر-پیکسلی در گرد کردن اولیه ترکیب از دست میرود. با این حال، برای بخش اعظم ناحیه واترمارک، بازیابی در مقایسه با لکههای AI تقریباً بینقص است.
برای جلوگیری از تخریب تصاویری که واترمارک ندارند، یک خط لوله (pipeline) مقاوم از سه مرحله اعتبارسنجی استفاده میکند:
۱. جستوجوی کاتالوگ: بررسی تطابق ابعاد تصویر با اندازههای خروجی شناختهشدهی Gemini.
۲. جستوجوی لنگر محلی: اسکن برای یافتن مکان دقیق لوگو در ناحیه مورد انتظار.
۳. اعتبارسنجی نتایج منطقی: اجرای ترکیب معکوس و تأیید اینکه خروجی پیش از اعمال تغییرات، منسجم به نظر میرسد.
اجرای محلی در برابر استنتاج مدل
این فرآیند بهطور کامل در مرورگر و با استفاده از Canvas API و JavaScript اجرا میشود. برخلاف روشهای مبتنی بر مدل انتشار (Diffusion Model) برای ترمیم تصویر، این روش نیازی به آپلود در سرور، صفهای GPU یا مدلهای میزبانیشده ندارد. کل ابزار تنها از چند صد کیلوبایت کد تشکیل شده است.
این موضوع تفاوت «معکوس کردن یک عملیات شناختهشده» را با «اختراع یک عملیات محتمل» روشن میکند. در حالی که مدلهای انتشار برای اشیاء دلخواه یا واترمارکهای کاملاً کدر ضروری هستند، برای ترکیبهای قطعی، استفاده از آنها زیادهروی است.
برای کسانی که میخواهند این روش را پیاده کنند، الگوریتم و کاتالوگهای اندازه در پروژه gemini-watermark-remover در گیتهاب در دسترس است که نسخهای جاوااسکریپتی از ابزار اصلی Allen Kuo است.
این چرخش در رویکرد ثابت میکند که تصور «هوش مصنوعی باید اثر هوش مصنوعی را پاک کند» اغلب یک باور غلط است. وقتی نشانی از ریاضی ساخته شده، با ریاضی پاک میشود و ابزارهای حدس زنی مولد را برای این کار خاص منسوخ میکند.
گام بعدی شما
- اگر برنامهنویس هستید، مخزن gemini-watermark-remover را در گیتهاب بررسی کنید تا با منطق معکوسسازی پیکسلی آشنا شوید.
- هنگام ارزیابی ابزارهای حذف واترمارک، بین روشهای «تولیدی/حدسی» و «حسابی/قطعی» تفاوت قائل شوید.
- دقت کنید که این روش تنها برای ترکیبهای آلفا کار میکند و روی واترمارکهای تخریبی (Destructive) اثر ندارد.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو