موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

انقلاب در دسترسی به WanVideo: یکپارچگی کامل مدل‌های ویدئویی در ComfyUI

Kijai با تجمیع مدل‌های پراکنده WanVideo در یک مخزن واحد، سد ورود به دنیای تولید ویدئوی محلی را شکست. این اقدام دسترسی به مدل‌های کوانتیزه شده از ByteDance و Alibaba را برای…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر مدل‌های حجیم؛ Qwen3.6-27B قواعد کدنویسی را تغییر داد

مدل جدید علی‌بابا با ۲۷ میلیارد پارامتر، مدل غول‌پیکر ۳۹۷ میلیاردی предшеل خود را در بنچمارک‌های کدنویسی شکست داد. این دستاورد ثابت می‌کند که بهینه‌سازی معماری بر حجم عظیم داده‌ها…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان عصر OCRهای گران‌قیمت؛ مدل olmOCR بازی را عوض کرد

مؤسسه Allen AI مدل olmOCR را برای استخراج ساختاریافته‌ی متن از تصاویر اسناد معرفی کرد. این مدل با وزن‌های باز، جایگزینی قدرتمند و محلی برای سرویس‌های تجاری OCR است که پردازش انبوه…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

ضربه‌ی Phi-4 به Whisper؛ انقلاب مدل‌های چندوجهی کوچک

مایکروسافت با معرفی Phi-4-multimodal-instruct، مدل‌های غول‌آسای صوتی را به چالش کشید. این مدل ۵.۶ میلیارد پارامتری با ترکیب متن، تصویر و صوت در یک شبکه واحد، رکورد جدیدی در دقت…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان سلطه‌ی مدل‌های بسته؛ Wan2.1 استانداردهای تولید ویدیو را جابه‌جا کرد

تیم Wan در ۲۲ فوریه ۲۰۲۵ مدل‌های Wan2.1 را منتشر کرد که ادعای برتری نسبت به رقبای بسته را دارد. این مجموعه شامل یک مدل پرچم‌دار ۱۴ میلیارد پارامتری و یک مدل سبک ۱.۳ میلیارد…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

پایان عصر برنامه‌ریزی دستی؛ هوش مصنوعی فرمان رانندگی در مریخ را گرفت

برای اولین بار، یک هوش مصنوعی مسیر حرکت یک کاوشگر مریخی را طراحی کرد. این اقدام باعث کاهش ۵۰ درصدی حجم کاری مهندسان ناسا شده و مسیر را برای ماموریت‌های خودگردان آینده هموار می‌کند.

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

پایان سلطه مدل‌های بسته: FLUX.1 [dev] بازی را عوض می‌کند

شرکت **Black Forest Labs** مدل **FLUX.1 [dev]** را با ۱۲ میلیارد پارامتر و وزن‌های باز عرضه کرد. این مدل در کیفیت و درک پرامپت‌ها با رقبای تجاری برابری می‌کند، هرچند مجوز آن…

۲ دقیقه خواندن