موضوع

هوش لبه

SLMs, on-device inference, mobile AI, AI PCs

۴۷۴ مقاله منتشر شده

چرا گلوگاه AGI دیگر الگوریتم نیست، بلکه سیستم خنک‌کننده است؟

LG و NVIDIA برای عبور از سد شبیه‌سازی و ورود به دنیای واقعی متحد شده‌اند. این همکاری بر سه نقطه بحرانی تمرکز دارد: خنک‌سازی مراکز داده، کاهش تأخیر استنتاج در رباتیک و یکپارچه‌سازی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

جادوی ۴۴۰ مگابایتی تنسنت برای شکست دادن گوگل ترنسلیت

تنسنت یک مدل ترجمه فوق‌فشرده و آفلاین را معرفی کرد که با حجم تنها ۴۴۰ مگابایت، کیفیتی در سطح سیستم‌های تجاری بزرگ دارد. این مدل ۳۳ زبان را پشتیبانی می‌کند و نیاز به اتصال ابری را…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

QYOLO: جادوی میکسینگ کوانتومی برای حذف ۲۰ درصدی پارامترهای YOLOv8

پژوهشگران با معرفی چارچوب QYOLO توانستند حجم مدل‌های تشخیص شیء را بیش از ۲۰ درصد کاهش دهند. این دستاورد با جایگزینی ماژول‌های سنگین با میکسینگ الهام‌گرفته از کوانتوم به دست آمده و…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان سلطه‌ی مدل‌های حجیم: چگونه Granite 4.1 قواعد بازی را تغییر داد

IBM با معرفی خانواده‌ی Granite 4.1 ثابت کرد که مدل‌های کوچک‌تر با داده‌های باکیفیت می‌توانند مدل‌های غول‌پیکر را شکست دهند. نسخه‌ی ۸ میلیاردی این مدل در بنچمارک‌های کلیدی، عملکرد…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از TIDE: وقتی مدل‌های کوچک از غول‌ها تقلید می‌کنند

پژوهشگران چارچوب TIDE را معرفی کردند که اجازه می‌دهد مدل‌های کوچک از مدل‌های غول‌پیکر یاد بگیرند. این فناوری شکاف معماری را از بین برده و قدرت کدنویسی مدل‌های کوچک را به شدت…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سقوط پارادایم آموزش: یافتن معماری‌های مینیمال با قدرت تصادف

روشی جدید به نام Random Cloud اجازه می‌دهد بدون نیاز به آموزش اولیه، کوچک‌ترین و بهین‌ترین ساختار شبکه‌های عصبی شناسایی شوند. این متد با جایگزینی چرخه پرهزینه…

۲ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

چرا پهپادهای امداد و نجات دیگر نیازی به آموزش‌های طولانی ندارند؟

یک چارچوب سلسله‌مراتبی جدید با ترکیب قوانین قطعی و یادگیری تقویت‌شده، ایمنی پهپادها را در عملیات امداد و نجات متحول کرده است. این سیستم حتی بدون پیش‌آموزش، نرخ برخوردها را کاهش…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

مدل ۷ میلیاردی که GPT-4o را در اورژانس شکست داد

یک مدل تخصصی Qwen2.5-7B در تریاژ پزشکی از GPT-4o پیشی گرفت. این نتیجه ثابت می‌کند تنظیم دقیق روی داده‌های بالینی بسیار موثرتر از تکیه بر مدل‌های عمومی عظیم است.

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

زبان ساده، نجات‌بخش: وقتی انگلیسی A2 بر مدل‌های پیچیده غلبه می‌کند

پژوهشگران با طراحی یک خط لوله تطبیقی، ثابت کردند که استفاده از انگلیسی ساده در زمان بحران‌ها، سرعت و دقت ترجمه را به‌شدت افزایش می‌دهد. این سیستم با تمرکز بر مدل‌های زبانی کوچک،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پایان عصر رگرسیون در ناوبری فضایی: رمزگشایی از قدرت Star-Fusion

مدل جدید Star-Fusion با تغییر رویکرد از رگرسیون به طبقه‌بندی گسسته، مشکل «گم‌شدن در فضا» را حل کرده است. این معماری چندوجهی با دقت ۹۳.۴ درصد و تأخیر بسیار کم، استقرار ماهواره‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

درون معماری DUAL-BLADE: عبور از سد حافظه در سخت‌افزارهای مصرف‌کننده

پژوهشگران با معرفی چارچوب DUAL-BLADE، گلوگاه حافظه در رایانش لبه را با حذف حافظه‌ی صفحه‌ی هسته (Kernel Page Cache) شکستند. این سیستم تأخیر استنتاج را به‌طور چشمگیری کاهش داده و…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا استقرار هوش مصنوعی در لبه بدون Meta AutoEncoder شکست می‌خورد

پژوهشگران راهکاری برای کاهش تأخیر در مدل‌های چندوجهی (VLM) ابداع کرده‌اند که ارتباط بین دستگاه‌های لبه و ابر را بهینه می‌کند. این سیستم با استفاده از Meta AutoEncoder، داده‌های…

۲ دقیقه خواندن