پرش به محتوای اصلی

موضوع

چندوجهی

Models that natively process text+image+audio+video

۴۰۳ مقاله منتشر شده

چگونه LoopVLA با یادگیری «کفایت»، پارامترهای مدل‌های VLA را ۴۵٪ کاهش داد؟

چگونه LoopVLA با یادگیری «کفایت»، پارامترهای مدل‌های VLA را ۴۵٪ کاهش داد؟

معماری LoopVLA با معرفی مفهوم «یادگیری کفایت»، نیاز به پردازش در تمام لایه‌های عمیق مدل‌های VLA را حذف کرده است. این رویکرد منجر به کاهش ۴۵ درصدی پارامترها و افزایش ۱.۷ برابری…

۲ دقیقه خواندن
شکاف ادراکی-عملیاتی در KnotBench: دلیل شکست GPT-5 در استدلال دیاگرامی

شکاف ادراکی-عملیاتی در KnotBench: دلیل شکست GPT-5 در استدلال دیاگرامی

بنچمارک جدید KnotBench نشان می‌دهد مدل‌های پیشرو در استدلال دیاگرامی گره‌ها، عملکردی نزدیک به حدس تصادفی دارند. این مطالعه یک «شکاف ادراکی-عملیاتی» حیاتی را شناسایی کرده است که در…

۲ دقیقه خواندن
چگونه «عمق تعهد یادگیرای» مدل‌های کوچک را در استدلال از GPT-5.5 پیشتاز کرد؟

چگونه «عمق تعهد یادگیرای» مدل‌های کوچک را در استدلال از GPT-5.5 پیشتاز کرد؟

یک مدل ۷ میلیارد پارامتری با استفاده از متغیر «عمق تعهد یادگیرای»، در وظایف استدلالی بلندمدت از GPT-5.5 و Claude Sonnet پیشی گرفت. این رویکرد با بهینه‌سازی زمان بازطراحی…

۲ دقیقه خواندن
گزارش Palisade: سرعت تکثیر عامل‌های هوش مصنوعی از آمریکا تا هند در ۵۰ دقیقه

گزارش Palisade: سرعت تکثیر عامل‌های هوش مصنوعی از آمریکا تا هند در ۵۰ دقیقه

هوش مصنوعی از یک ابزار کمکی به عامل‌های خودکاری تبدیل شده که قادر به تکثیر سریع و حتی بازنویسی درایورهای سیستم هستند. این تحول، معماری مراکز داده را به سمتی می‌برد که در آن…

۳ دقیقه خواندن
Interfaze: پیروزی معماری ترکیبی در ۹ بنچمارک قطعی در برابر Gemini-3-Flash

Interfaze: پیروزی معماری ترکیبی در ۹ بنچمارک قطعی در برابر Gemini-3-Flash

Interfaze یک معماری ترکیبی جدید است که دقت شبکه‌های عصبی قدیمی را با انعطاف‌پذیری ترنسفورمرها ادغام کرده است. این مدل در وظایف قطعی مانند OCR و تبدیل گفتار به متن، مدل‌های Mini…

۲ دقیقه خواندن
چرا توکنایزر جدید Claude Opus 4.7 هزینه‌های عملیاتی را ۳۵٪ افزایش می‌دهد؟
آموزش کاربردی

چرا توکنایزر جدید Claude Opus 4.7 هزینه‌های عملیاتی را ۳۵٪ افزایش می‌دهد؟

آنتروپیک مدل Claude Opus 4.7 را با تمرکز بر کنترل دقیق عامل‌های خودکار و بینایی با رزولوشن بالا معرفی کرد. با وجود ثابت ماندن قیمت هر توکن، تغییر در توکنایزر باعث افزایش هزینه‌های…

۲ دقیقه خواندن
چرا Wispr Flow برای تسخیر بازار هند، درآمد را فدای حجم داده می‌کند؟

چرا Wispr Flow برای تسخیر بازار هند، درآمد را فدای حجم داده می‌کند؟

استارتاپ Wispr Flow با عرضه مدل صوتی مخصوص «هینگلیش» و کاهش شدید قیمت‌ها، رشد ماهانه ۱۰۰ درصدی را در هند تجربه کرده است. این شرکت در تلاش است تا با پذیرش حجم بالای کاربر در برابر…

۲ دقیقه خواندن
راز ۴ مگابایتی Anodos برای غلبه بر هرج‌ومرج صوتی در کارگاه‌های ساختمانی
آموزش کاربردی

راز ۴ مگابایتی Anodos برای غلبه بر هرج‌ومرج صوتی در کارگاه‌های ساختمانی

شرکت Anodos با طراحی یک خط لوله صوتی تخصصی، مشکل ثبت یادداشت در محیط‌های پرصدا را حل کرد. آن‌ها با اولویت دادن به سرعت پاسخ‌دهی و لایه‌های اصلاحی کوچک به جای مدل‌های غول‌پیکر،…

۳ دقیقه خواندن