اگر ماهانه ۲۰۰ دلار برای ابزارهای تولید ویدیو میپردازید، در واقع دارید برای یک محصول تکراری هزینه اضافی میدهید. در ۹ ژوئن ۲۰۲۶، علی ییلماز (Ali Yilmaz) راهی را برای دور زدن این هزینهها با معرفی AI Shorts Factory افشا کرد.
بازار فعلی ویدیوهای هوش مصنوعی بر پایه اشتراکهای گرانقیمت و اکوسیستمهای بسته است. این وضعیت شبیه اجارهی اتاقی است که هرگز مالکش نمیشوید. همانطور که در تحلیلهای پیشین ما دربارهی ابزارهای متنباز اشاره کردیم، مالکیت زیرساخت تنها راه رهایی از وابستگی است.
طبق گزارش ییلماز در وبسایت dev.to، این راهکار بر پایه n8n است؛ پلتفرمی برای اتوماسیون که مثل یک جعبه لگوی دیجیتال، ابزارهای مختلف را به هم میچسباند. مراحل این گردش کار شامل موارد زیر است:
- GPT (مدل زبانی بزرگ یا LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — متنی ۶۰ ثانیهای برای حفظ مخاطب مینویسد.
- سیستم از طریق APIهای Unsplash و Pexels تصاویر رایگان میگیرد.
- ElevenLabs یا Play.ht متن را به صدای طبیعی تبدیل میکنند.
- FFmpeg تصاویر و صدا را ترکیب کرده و زیرنویسهای تولیدشده توسط Whisper را میچسباند.
- ویدیو نهایی بهطور خودکار در تیکتاک، اینستاگرام و یوتیوب منتشر میشود.
این تغییر، تولیدکننده را از یک «اجارهکننده» به «مالک» تبدیل میکند. با پرداخت یکبارهی ۲۰ دلار به جای ۲۴۰۰ دلار در سال، هزینه ۹۹٪ کاهش مییابد. به باور ما، این یعنی کنترل کامل روی کد منبع و امکان افزودن قابلیتهای جدید بدون اجازه هیچ شرکتی.
گام بعدی شما
- بررسی نصب n8n روی سرور شخصی (Docker) برای حذف هزینههای ماهانه.
- جایگزینی APIهای گرانقیمت با مدلهای متنباز در زنجیره تولید.
- تست مدلهای مختلف تبدیل متن به صدا برای یافتن ارزانترین گزینه.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.
گفتگو