تصور کنید بتوانید یک تصویر فوقالعاده باکیفیت را تنها در یک گام تولید کنید، بدون اینکه ذرهای از جزئیات قربانی شود. اگر هنوز منتظر دهها مرحله استنتاج در مدلهای انتشار هستید، باید بدانید که قواعد بازی تغییر کرده است.
به نقل از تحلیل فنی سندر دیلمن (Sander Dieleman) در ۶ می ۲۰۲۶، پاسخ این معما در «نقشههای جریان» (Flow Maps) نهفته است؛ تعمیمی از مدلهای انتشار (Diffusion Models) که فرآیند تکراری حذف نویز را با انتگرالگیری مستقیم از مسیر جایگزین میکند.
مدلهای انتشار استاندارد دچار «کوتاهبینی» هستند؛ آنها در هر مرحله تنها یک جهت مماس محلی را پیشبینی میکنند و برای رسیدن به یک تصویر شفاف، به دهها تکرار نیاز دارند. اما نقشههای جریان یاد میگیرند که هر نقطهای از یک مسیر را از هر نقطه دیگر پیشبینی کنند و در واقع انتگرالِ مسیرِ تبدیل نویز به داده را محاسبه میکنند.

این دیدگاه کلی، نمونهبرداری تکمرحلهای را ممکن میسازد. این چارچوب بر سه قانون اساسی سازگاری تکیه دارد تا مدل از مسیر تعیینشده منحرف نشود:
- ترکیبپذیری (Compositionality): حرکت از نقطه الف به ب و سپس ب به ج، باید نتیجهای یکسان با حرکت مستقیم از الف به ج داشته باشد.

- سازگاری لاگرانژی (Lagrangian Consistency): ردیابی نحوه تکامل خروجی با تغییر گام زمانی هدف.

- سازگاری اویلری (Eulerian Consistency): اطمینان از اینکه مقصد با تغییر نقطه شروع، ثابت باقی میماند.

طبق گزارش منتشر شده، مقیاسپذیری این روش در استقرارهای بزرگ اثبات شده است. روش تطبیق سرعت نهایی (Terminal Velocity Matching یا TVM) با موفقیت در مدلهایی با بیش از ۱۰ میلیارد پارامتر به کار گرفته شده است. همچنین، مدلهای سازگاری مهارشده با جریان (Flow-anchored Consistency Models یا FACM) برای تقطیر مدل تولید ویدیو Wan 2.2 با ۱۴ میلیارد پارامتر استفاده شدند تا نمونههای باکیفیت را تنها در ۲ تا ۸ گام تولید کنند. به همین ترتیب، متد Align Your Flow (AYF) تعداد گامهای نمونهبرداری در FLUX.1-dev را به ۴ گام کاهش داد.
همانطور که در تحلیل قبلی ما دربارهی قوانین مقیاسپذیری مدلهای تصویری اشاره کردیم، بهینهسازی استنتاج کلید پذیرش گسترده این فناوری است. اگرچه آموزش نقشههای جریان از نظر محاسباتی گرانتر از مدلهای انتشار استاندارد است، اما دستاوردهای آن در مرحله استنتاج (Inference) خیرهکننده است. برخلاف تقطیر توزیعی، نقشههای جریان نگاشت دوجهت بین نویز و داده را حفظ میکنند که امکان ویرایش دقیق تصاویر و تخمین احتمال را فراهم میکند.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گام بعدی شما
- اگر از مدل FLUX.1-dev استفاده میکنید، تنظیمات نمونهبرداری را روی ۴ گام تست کنید تا سرعت تولید را بسنجید.
- برای توسعهدهندگان، مطالعه مستندات FACM برای کاهش هزینههای عملیاتی مدلهای ویدیو توصیه میشود.
- منتظر بهروزرسانیهای احتمالی در مدلهای زبانی بزرگ باشید که از نقشههای جریان برای دادههای دستهای استفاده میکنند.




گفتگو