پرش به محتوای اصلی

موضوع

هوش لبه

SLMs, on-device inference, mobile AI, AI PCs

۴۷۸ مقاله منتشر شده

افزایش ۳ تا ۶ برابری سرعت استنتاج مدل‌های PyTorch در مک‌های اپل سیلیکون
آموزش کاربردی

افزایش ۳ تا ۶ برابری سرعت استنتاج مدل‌های PyTorch در مک‌های اپل سیلیکون

پایتورچ یک ابزار آزمایشی به نام MLX Delegate را برای ExecuTorch منتشر کرد که سرعت اجرای مدل‌های هوش مصنوعی زاینده را در مک‌های اپل سیلیکون تا ۶ برابر افزایش می‌دهد. این ابزار با…

۲ دقیقه خواندن
چگونه فناوری PinTILT مشکل باتری و وزن عینک‌های هوش مصنوعی را حل می‌کند؟

چگونه فناوری PinTILT مشکل باتری و وزن عینک‌های هوش مصنوعی را حل می‌کند؟

استارتاپ کره‌ای LetinAR با جذب ۱۸.۵ میلیون دلار، فناوری اپتیکی PinTILT را برای تولید عینک‌های هوشمند سبک و کم‌مصرف توسعه می‌دهد. این نوآوری توازن بین روشنایی تصویر و عمر باتری را…

۲ دقیقه خواندن
مدل EMO و معماری MoE؛ حفظ عملکرد کامل با حذف ۸۷.۵٪ از متخصصان

مدل EMO و معماری MoE؛ حفظ عملکرد کامل با حذف ۸۷.۵٪ از متخصصان

پژوهشگران مؤسسه Allen و دانشگاه برکلی مدلی به نام EMO را معرفی کردند که با سازمان‌دهی متخصصان بر اساس دامنه‌های معنایی، عملکرد خود را حتی با حذف ۸۷.۵٪ از ظرفیت متخصصان حفظ می‌کند.

۳ دقیقه خواندن
چرا برای اجرای عامل‌های هوش مصنوعی دیگر نیازی به سرورهای ابری ندارید؟
آموزش کاربردی

چرا برای اجرای عامل‌های هوش مصنوعی دیگر نیازی به سرورهای ابری ندارید؟

توسعه‌دهندگان با استفاده از Hermes Agent و Termux، گوشی‌های اندرویدی را به ایستگاه‌های کاری هوش مصنوعی تبدیل می‌کنند. این عامل‌های خودگردان بدون نیاز به ابر، مخازن گیت‌هاب را…

۲ دقیقه خواندن
درون معماری Osaurus: تبدیل مک به سروری برای مدیریت مدل‌های محلی و ابری

درون معماری Osaurus: تبدیل مک به سروری برای مدیریت مدل‌های محلی و ابری

پروژه متن‌باز Osaurus به کاربران مک اجازه می‌دهد تا مدل‌های محلی و ابری را در یک محیط امن و ایزوله مدیریت کنند. این ابزار با انتقال کنترل داده‌ها از مراکز داده به سخت‌افزار شخصی،…

۲ دقیقه خواندن
چگونه whichllm انتخاب مدل‌های محلی را از حدس و گمان به داده تبدیل کرد؟
آموزش کاربردی

چگونه whichllm انتخاب مدل‌های محلی را از حدس و گمان به داده تبدیل کرد؟

ابزار جدید whichllm با اولویت دادن به بنچمارک‌های واقعی به‌جای تعداد پارامترها، بهترین مدل محلی را برای سخت‌افزار شما پیشنهاد می‌دهد. این ابزار مشخصات GPU و CPU را شناسایی کرده و…

۲ دقیقه خواندن
کاهش هزینه API به صفر؛ تجربه ۶ ماهه یک توسعه‌دهنده با مدل‌های محلی
آموزش کاربردی

کاهش هزینه API به صفر؛ تجربه ۶ ماهه یک توسعه‌دهنده با مدل‌های محلی

یک توسعه‌دهنده با انتقال به سخت‌افزار محلی و استفاده از مدل‌های Qwen و Ollama، هزینه‌های API خود را کاملاً حذف کرد. این تغییر، هزینه ماهانه را از پرداخت به شرکت‌های ابری به قبض…

۲ دقیقه خواندن