تصور کنید تصویری تولید میکنید که از نظر ریاضی بینقص است، اما چشم انسان فوراً متوجه میشود که چیزی میلنگد. این شکاف میان دقت عددی و کیفیت بصری، همان جایی است که ACPO وارد میدان میشود.
طبق اعلام مقالهای که در ۳۰ آوریل ۲۰۲۶ در arxiv.org منتشر شد، چارچوب بهینهسازی ادراکی با محدودیت لنگر (Anchor-Constrained Perceptual Optimization - ACPO) برای پر کردن این شکاف طراحی شده است. هدف این سیستم، تبدیل خروجیهای «صحیح اما خشک» به تصاویری است که از نظر بصری برای انسان جذابتر باشند.
به نقل از گزارش پژوهشگران، آموزشهای سنتی مدل انتشار (Diffusion Model) بر اهداف با مرجع کامل (Full-reference objectives) تکیه دارند. این روشها شباهت پیکسلی (Pixel-wise similarity) را با تصاویر واقعیت زمینی (Ground-truth) میسنجند. اگرچه این کار دقت بازسازی (Fidelity) را تضمین میکند، اما اغلب ترجیحات بصری انسان یا سازگاری معنایی متن و تصویر را نادیده میگیرد.
تیم تحقیق یک نقطه شکست حیاتی را شناسایی کرد: بهینهسازی مستقیم برای سیگنالهای سنجش کیفیت تصویر بدون مرجع (No-Reference Image Quality Assessment - NR-IQA) معمولاً باعث ناپایداری در آموزش و انحراف توزیعی (Distributional drift) میشود. برای حل این مشکل، ACPO یک استراتژی دوگانه را اجرا میکند:
- استفاده از یک مدل آموزشدیده NR-IQA به عنوان سیگنال هدایت ادراکی.
- معرفی منظمسازی مبتنی بر لنگر (Anchor-based regularization) برای حفظ سازگاری پیشبینی نویز با مدل پایه.
همانطور که در تحلیل قبلی ما دربارهی معیارهای ارزیابی مدلهای زاینده اشاره کردیم، تکیه صرف بر دادههای عددی همیشه پاسخگو نیست. این مکانیسم جدید به مدل اجازه میدهد بدون از دست دادن تنوع یا رفتار تولیدی، به سمت خروجیهای برتر از نظر ادراکی حرکت کند.
این تغییر رویکرد از «تطبیق پیکسلی» به «تطبیق ادراکی»، میتواند تعریف ما از موفقیت در هوش مصنوعی زاینده (Generative AI) را تغییر دهد. اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ اثر این بهینهسازی بر سرعت استنتاج (Inference) را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- بررسی متدولوژی NR-IQA برای ارزیابی دقیقتر خروجیهای بصری.
- دنبال کردن استانداردهای جدید «ضرر ادراکی» در تولید ویدیوهای بلادرنگ.
- مطالعه مستندات ACPO برای پیادهسازی منظمسازی لنگر در مدلهای شخصی.




گفتگو