پرش به محتوای اصلی

موضوع

هوش لبه

SLMs, on-device inference, mobile AI, AI PCs

۴۷۹ مقاله منتشر شده

چرا توسعه‌دهندگان مدل‌های ابری Claude را با Qwen 3.6 محلی جایگزین می‌کنند؟
زندگی با AIتأییدنشده · منبع منفرد

چرا توسعه‌دهندگان مدل‌های ابری Claude را با Qwen 3.6 محلی جایگزین می‌کنند؟

برنامه‌نویسان در حال جایگزینی اشتراک‌های گران‌قیمت ابری با پشته‌های محلی بر پایه Qwen 3.6 و Pi.dev هستند. این روند، اولویت را از «استدلال سطح ارشد» به «حریم خصوصی و هزینه صفر»…

۹ دقیقه خواندن
چگونه تقطیر قوانین فیزیکی از LLMها سرعت استنتاج صنعتی را به ۶۰۰۰ هرتز رساند

چگونه تقطیر قوانین فیزیکی از LLMها سرعت استنتاج صنعتی را به ۶۰۰۰ هرتز رساند

یک چارچوب جدید با استفاده از مدل‌های زبانی برای استخراج قوانین فیزیکی از متون علمی و تبدیل آن‌ها به شبکه‌های عصبی سبک برای محیط‌های صنعتی طراحی شده است. این روش امکان پیش‌بینی…

۲ دقیقه خواندن
کاهش ۴۴ درصدی تأخیر پردازش ECG در رایانش لبه با کوانتیزاسیون INT8

کاهش ۴۴ درصدی تأخیر پردازش ECG در رایانش لبه با کوانتیزاسیون INT8

یک سامانه جدید یادگیری فدرال برای تشخیص ناهنجاری‌های ECG، با ترکیب حریم خصوصی تفاضلی و کوانتیزاسیون INT8، دقت بالای مدل را در سخت‌افزارهای لبه حفظ می‌کند. این سیستم روی Raspberry…

۲ دقیقه خواندن
چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

یک چارچوب عامل‌محور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراه‌ها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت می‌کند مدل‌های ۸ میلیاردی در صورت مدیریت در یک سیستم…

۱ دقیقه خواندن
معماری پایپ‌لاین ASR سه‌مدله روی گوشی با Claude Code
آموزش کاربردی

چرا تسلط بر سینتکس برنامه‌نویسی دیگر مزیت رقابتی توسعه‌دهندگان نیست؟

یک توسعه‌دهنده تک‌نفره توانست تنها در دو ماه اپلیکیشن Traverba را بسازد. او با استفاده از Claude Code، پیچیدگی‌های فنی کدنویسی موبایل را حذف کرد تا روی بهینه‌سازی حافظه و باتری در…

۴ دقیقه خواندن
رابط کاربری برنامه دسکتاپ PaperQuay
آموزش کاربردیگزارش تأییدنشده

چرا پژوهشگران برتر، تحلیل مقالات خود را به حافظه محلی منتقل می‌کنند؟

اپلیکیشن PaperQuay با انتقال تحلیل‌های هوش مصنوعی به حافظه محلی، امنیت داده‌های حساس پژوهشی را تضمین می‌کند. این ابزار، مدیریت PDF، ترجمه و عامل‌های برنامه‌ریزی‌شده را در یک محیط…

۲ دقیقه خواندن
۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی
آموزش کاربردی

۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی

مهندسی هوش مصنوعی از رپرهای ساده‌ی API به سمت سیستم‌های عامل‌محور و تخصصی حرکت می‌کند. توسعه‌دهندگان برتر اکنون برای دستیابی به پایداری و کاهش هزینه، بر RAG عامل‌محور و مدل‌های…

۶ دقیقه خواندن
پیکربندی Firebase AI Logic در اندروید برای مدل‌های Gemini
آموزش کاربردی

Firebase AI Logic: حذف کامل نیاز به سرور برای استقرار مدل‌های Gemini

توسعه‌دهندگان اندروید حالا می‌توانند مدل‌های Gemini را بدون نیاز به سرور بک‌اند در اپلیکیشن‌های خود پیاده کنند. این ابزار مسیر انتقال از نسخه‌های رایگان آزمایشی به مقیاس صنعتی در…

۵ دقیقه خواندن