تصور کنید قدرتمندترین ابزارهای تولید تصویر دیگر در انحصار شرکتهای بزرگ نباشند. اگر هنوز برای خروجیهای حرفهای به اشتراکهای ماهانه متکی هستید، زمان تغییر است.
Black Forest Labs یک مدل تولید تصویر با ۱۲ میلیارد پارامتر عرضه کرده است که شکاف کیفی با جایگزینهای بسته را میبندد. اکنون میتوانید سنتز متن به تصویر در سطح حرفهای را بهصورت محلی اجرا کنید، به شرطی که به مجوز غیرتجاری آن پایبند باشید.
به نقل از مستندات Hugging Face، مدل FLUX.1 [dev] وزنهای باز (Open Weights) یک ترنسفورمر جریان اصلاحشده (Rectified Flow Transformer) را در اختیار پژوهشگران و هنرمندان قرار میدهد. طبق اعلام این شرکت، مدل مذکور تصاویری با رزولوشن ۱۰۲۴×۱۰۲۴ تولید میکند و کیفیت خروجی آن تنها یک پله پایینتر از مدل FLUX.1 [pro] است.

در لایههای زیرین، این مدل از تقطیر هدایت (Guidance Distillation) برای افزایش بهرهوری معماری استفاده میکند. وزنهای این مدل برای مصارف شخصی، علمی و غیرتجاری در دسترس است. همچنین نقاط اتصال API از طریق Replicate و fal.ai فعال شدهاند.
همانطور که در تحلیل قبلی ما دربارهی رقابت مدلهای متنباز و بسته اشاره کردیم، این رویکرد فشار را بر غولهای نرمافزاری افزایش میدهد. توسعهدهندگان میتوانند این مدل را در ComfyUI برای گردشکارهای گرهمحور یا از طریق کتابخانه Diffusers با چند خط کد پایتون اجرا کنند.
مشخصات کلیدی مدل عبارتند از:
- ۱۲ میلیارد پارامتر در معماری ترنسفورمر جریان اصلاحشده
- استفاده از تقطیر هدایت برای استنتاج (Inference) بهینه
- رزولوشن بومی ۱۰۲۴×۱۰۲۴
- پشتیبانی از ComfyUI، Diffusers و APIهای Replicate و fal.ai
قوانین مجوز این مدل بسیار سختگیرانه است. مجوز غیرتجاری FLUX.1 [dev] صراحتاً تصمیمگیریهای خودکار که بر حقوق قانونی اثر میگذارد را ممنوع میکند. همچنین تولید محتوای گمراهکننده در مقیاس بزرگ و تصاویر بدون رضایت افراد در این مدل ممنوع است.
باید بدانید که این مدل برای ارائه اطلاعات واقعی طراحی نشده و ممکن است سوگیریهای اجتماعی را تقویت کند.
اما این تنها بخشی از معماری جدید است؛ تأثیر این مدل بر سختافزارهای لبه را در گزارش بعدی بررسی میکنیم.
گام بعدی شما
- مدل را از طریق Hugging Face دریافت کرده و در ComfyUI تست کنید.
- مستندات کتابخانه Diffusers را برای پیادهسازی سریع مطالعه کنید.
- تفاوت خروجیهای مدل [dev] و [pro] را در fal.ai مقایسه کنید.
![پایان سلطه مدلهای بسته: FLUX.1 [dev] بازی را عوض میکند](/_next/image?url=https%3A%2F%2Fwww.dothoosh.com%2Fmedia%2Fdff013ee-16cd-56f4-8783-fe49fdf34157-flux-1-dev-distills-state-of-the-art-image-generation-into-open-weights-e8164f94.webp&w=1920&q=75)



گفتگو