
چرا گلوگاه AGI دیگر الگوریتم نیست، بلکه سیستم خنککننده است؟
LG و NVIDIA برای عبور از سد شبیهسازی و ورود به دنیای واقعی متحد شدهاند. این همکاری بر سه نقطه بحرانی تمرکز دارد: خنکسازی مراکز داده، کاهش تأخیر استنتاج در رباتیک و یکپارچهسازی…
موضوع
SLMs, on-device inference, mobile AI, AI PCs
۴۷۴ مقاله منتشر شده

LG و NVIDIA برای عبور از سد شبیهسازی و ورود به دنیای واقعی متحد شدهاند. این همکاری بر سه نقطه بحرانی تمرکز دارد: خنکسازی مراکز داده، کاهش تأخیر استنتاج در رباتیک و یکپارچهسازی…

تنسنت یک مدل ترجمه فوقفشرده و آفلاین را معرفی کرد که با حجم تنها ۴۴۰ مگابایت، کیفیتی در سطح سیستمهای تجاری بزرگ دارد. این مدل ۳۳ زبان را پشتیبانی میکند و نیاز به اتصال ابری را…

پژوهشگران با معرفی چارچوب QYOLO توانستند حجم مدلهای تشخیص شیء را بیش از ۲۰ درصد کاهش دهند. این دستاورد با جایگزینی ماژولهای سنگین با میکسینگ الهامگرفته از کوانتوم به دست آمده و…

IBM با معرفی خانوادهی Granite 4.1 ثابت کرد که مدلهای کوچکتر با دادههای باکیفیت میتوانند مدلهای غولپیکر را شکست دهند. نسخهی ۸ میلیاردی این مدل در بنچمارکهای کلیدی، عملکرد…

پژوهشگران چارچوب TIDE را معرفی کردند که اجازه میدهد مدلهای کوچک از مدلهای غولپیکر یاد بگیرند. این فناوری شکاف معماری را از بین برده و قدرت کدنویسی مدلهای کوچک را به شدت…

روشی جدید به نام Random Cloud اجازه میدهد بدون نیاز به آموزش اولیه، کوچکترین و بهینترین ساختار شبکههای عصبی شناسایی شوند. این متد با جایگزینی چرخه پرهزینه…

یک چارچوب سلسلهمراتبی جدید با ترکیب قوانین قطعی و یادگیری تقویتشده، ایمنی پهپادها را در عملیات امداد و نجات متحول کرده است. این سیستم حتی بدون پیشآموزش، نرخ برخوردها را کاهش…

یک مدل تخصصی Qwen2.5-7B در تریاژ پزشکی از GPT-4o پیشی گرفت. این نتیجه ثابت میکند تنظیم دقیق روی دادههای بالینی بسیار موثرتر از تکیه بر مدلهای عمومی عظیم است.

پژوهشگران با طراحی یک خط لوله تطبیقی، ثابت کردند که استفاده از انگلیسی ساده در زمان بحرانها، سرعت و دقت ترجمه را بهشدت افزایش میدهد. این سیستم با تمرکز بر مدلهای زبانی کوچک،…

مدل جدید Star-Fusion با تغییر رویکرد از رگرسیون به طبقهبندی گسسته، مشکل «گمشدن در فضا» را حل کرده است. این معماری چندوجهی با دقت ۹۳.۴ درصد و تأخیر بسیار کم، استقرار ماهوارههای…

پژوهشگران با معرفی چارچوب DUAL-BLADE، گلوگاه حافظه در رایانش لبه را با حذف حافظهی صفحهی هسته (Kernel Page Cache) شکستند. این سیستم تأخیر استنتاج را بهطور چشمگیری کاهش داده و…

پژوهشگران راهکاری برای کاهش تأخیر در مدلهای چندوجهی (VLM) ابداع کردهاند که ارتباط بین دستگاههای لبه و ابر را بهینه میکند. این سیستم با استفاده از Meta AutoEncoder، دادههای…