
پایان عصر سرورهای گرانقیمت: DeepSeek-R1 روی سختافزار خانگی مینشیند
تیم Unsloth با ارائه نسخههای بهینهشدهی DeepSeek-R1، مدل ۶۷۱ میلیارد پارامتری را برای سختافزارهای مصرفکننده در دسترس قرار داد. این دستاورد به لطف تکنیک کوانتایزیشن ۱.۵۸ بیتی،…
دستهبندی
بهروزرسانیهای کوتاه و سریع: عرضهها، شراکتها، سرمایهگذاری، قوانین و اخبار سختافزار. نبض پنجدقیقهای صبح.
۱٬۳۵۲ مقاله منتشر شده

تیم Unsloth با ارائه نسخههای بهینهشدهی DeepSeek-R1، مدل ۶۷۱ میلیارد پارامتری را برای سختافزارهای مصرفکننده در دسترس قرار داد. این دستاورد به لطف تکنیک کوانتایزیشن ۱.۵۸ بیتی،…

مایکروسافت مدل WHAM را معرفی کرد؛ یک مدل دنیای زاینده که میتواند بصریات بازی و اقدامات بازیکن را پیشبینی کند. این مدل با انتشار وزنهای باز در Hugging Face، مسیر جدیدی برای…

مدل Kokoro با تنها ۸۲ میلیون پارامتر، کیفیت صدای رقبای بزرگتر را با هزینهای کمتر از ۱ دلار برای هر میلیون نویسه به دست آورده است. این مدل با لایسنس آپاچی منتشر شده و مسیر جدیدی…

مؤسسه Allen AI مدل olmOCR را برای استخراج ساختاریافتهی متن از تصاویر اسناد معرفی کرد. این مدل با وزنهای باز، جایگزینی قدرتمند و محلی برای سرویسهای تجاری OCR است که پردازش انبوه…

مایکروسافت با معرفی Phi-4-multimodal-instruct، مدلهای غولآسای صوتی را به چالش کشید. این مدل ۵.۶ میلیارد پارامتری با ترکیب متن، تصویر و صوت در یک شبکه واحد، رکورد جدیدی در دقت…

تیم Wan در ۲۲ فوریه ۲۰۲۵ مدلهای Wan2.1 را منتشر کرد که ادعای برتری نسبت به رقبای بسته را دارد. این مجموعه شامل یک مدل پرچمدار ۱۴ میلیارد پارامتری و یک مدل سبک ۱.۳ میلیارد…

نسخه جدید Jaeger با بازطراحی کامل بر پایه OpenTelemetry، امکان ردیابی دقیق فراخوانهای مدلهای زبانی و زنجیرههای استدلالی را فراهم کرده است. این ابزار اکنون به مهندسان اجازه…
![پایان سلطه مدلهای بسته: FLUX.1 [dev] بازی را عوض میکند](/_next/image?url=https%3A%2F%2Fwww.dothoosh.com%2Fmedia%2Fdff013ee-16cd-56f4-8783-fe49fdf34157-flux-1-dev-distills-state-of-the-art-image-generation-into-open-weights-e8164f94.webp&w=1920&q=75)
شرکت **Black Forest Labs** مدل **FLUX.1 [dev]** را با ۱۲ میلیارد پارامتر و وزنهای باز عرضه کرد. این مدل در کیفیت و درک پرامپتها با رقبای تجاری برابری میکند، هرچند مجوز آن…

شرکت OpenAI در راهنمای جدید خود اعلام کرد که توسعهدهندگان باید پرامپتهای قدیمی را کنار بگذارند. در GPT-5.5، دستورات مفصل و فرآیندمحور باعث کاهش کیفیت پاسخها میشوند و رویکرد…

پژوهش تازه نشان میدهد اضافه کردن ماژولهای خودنظارتی بهعنوان قطعات جانبی، هیچ بهبودی ایجاد نمیکند. اما یکپارچهسازی ساختاری این ماژولها در مسیر تصمیمگیری، نتایج قابلتوجهی…

گوگل اپلیکیشن بومی **جمینای** (Gemini) را برای رایانههای مک منتشر کرد. کاربران با میانبر Option + Space از هر نقطهای در سیستم به دستیار هوش مصنوعی دسترسی دارند. این حرکت گوگل را…

چارچوب جدید هوش مصنوعی INFORM-CT با ترکیب مدلهای زبانی بزرگ و مدلهای بینایی-زبانی، شناسایی و گزارشدهی یافتههای جانبی در سیتی اسکن شکمی را خودکار میکند. این سیستم با رویکرد…