تصور کنید شخصیت اصلی ویدیوی شما، درست در لحظهای که سرش را میچرخاند، به فردی دیگر تبدیل شود. اگر هنوز با مشکل تغییر چهره در ویدیوهای تولید شده توسط AI دستوپنجه نرم میکنید، باید بدانید که این نقص فنی، بزرگترین مانع در مسیر رسیدن به کیفیت سینمایی است.
در ۷ می ۲۰۲۶، پژوهشگران چارچوب FaithfulFaces را معرفی کردند؛ سیستمی که هدف آن حذف کامل دگرگونیهای چهره در صحنههای پیچیده و پویا است. به نقل از گزارش arxiv.org، این سیستم یک پیشفرض چهرهای (Facial Prior) قدرتمند ایجاد میکند که مدلهای هوش مصنوعی زاینده (Generative AI) را به سمت ثبات هویت و شفافیت ساختاری هدایت میکند.
طبق اعلام تیم توسعه، این پیشرفت فنی بر سه مکانیسم کلیدی استوار است:
- همراستاساز هویت مشترک-پوز (Pose-shared identity aligner) که پوزهای چهره را در نماهای مختلف اصلاح میکند.
- یک دیکشنری مشترک-پوز که با محدودیت «تغییر پوز-ثبات هویت» ترکیب شده است.
- نگاشت ورودیهای تک-نما به یک نمایش جهانی از پوز چهره با استفاده از بردار معنایی (Embedding) صریح زوایای اویلر (Euler angle).
برای آموزش این مدل، تیم یک خط لوله (Pipeline) تخصصی برای جمعآوری مجموعهدادههای ویدیویی با تنوع پوز بالا طراحی کرد. اگرچه پژوهشگران در چکیده مقاله درصد دقیقی از بنچمارکها را منتشر نکردند، اما ادعا میکنند که این چارچوب در حفظ هویت هنگام انسدادها (Occlusions)، عملکردی در سطح SOTA (بهترین وضعیت فعلی) دارد.
همانطور که در تحلیل قبلی ما دربارهی Step-Video-T2V اشاره کردیم، صنعت به سمت استانداردهای باز در تولید ویدیو حرکت میکند؛ اما FaithfulFaces تمرکز را از حرکات کلی به دقتهای ذرهبینی و انسانمحور تغییر میدهد.
این تحول، گسست میان ویدیوهای «تولید شده توسط ماشین» و آثار بصری حرفهای را پر میکند. اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گام بعدی شما
- اگر تولیدکننده محتوا هستید، بررسی کنید که آیا مدلهای فعلی شما در چرخشهای ۱۸۰ درجه چهره، هویت را حفظ میکنند یا خیر.
- دنبال ادغام متدهای Euler angle در گردش کارهای (Workflow) تولید ویدیو باشید.
- منتظر انتشار وزنهای باز این مدل برای تست در محیطهای محلی باشید.




گفتگو