
ضربهی Phi-4 به Whisper؛ انقلاب مدلهای چندوجهی کوچک
مایکروسافت با معرفی Phi-4-multimodal-instruct، مدلهای غولآسای صوتی را به چالش کشید. این مدل ۵.۶ میلیارد پارامتری با ترکیب متن، تصویر و صوت در یک شبکه واحد، رکورد جدیدی در دقت…
۳ دقیقه خواندن
موضوع
Alignment research, RLHF, Constitutional AI, safety training
۲۶۶ مقاله منتشر شده

مایکروسافت با معرفی Phi-4-multimodal-instruct، مدلهای غولآسای صوتی را به چالش کشید. این مدل ۵.۶ میلیارد پارامتری با ترکیب متن، تصویر و صوت در یک شبکه واحد، رکورد جدیدی در دقت…
![پایان سلطه مدلهای بسته: FLUX.1 [dev] بازی را عوض میکند](/_next/image?url=https%3A%2F%2Fwww.dothoosh.com%2Fmedia%2Fdff013ee-16cd-56f4-8783-fe49fdf34157-flux-1-dev-distills-state-of-the-art-image-generation-into-open-weights-e8164f94.webp&w=1920&q=75)
شرکت **Black Forest Labs** مدل **FLUX.1 [dev]** را با ۱۲ میلیارد پارامتر و وزنهای باز عرضه کرد. این مدل در کیفیت و درک پرامپتها با رقبای تجاری برابری میکند، هرچند مجوز آن…