موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

چرا VEXR Ultra برای تبدیل شدن به همکاری صادق‌تر، دستورات کاربر را رد می‌کند؟

VEXR Ultra یک موتور استدلالی است که گاردریل‌های پنهان شرکتی را با یک قانون اساسی شفافِ ۳۴ ماده‌ای جایگزین کرده است. این مدل برخلاف هوش مصنوعی‌های سنتی، می‌تواند بدون ارائه دلیل از…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا نباید داده‌های خام Prometheus را مستقیماً به مدل‌های زبانی داد؟

برای جلوگیری از توهمات ریاضی و نشت داده‌ها، یک توسعه‌دهنده لایه‌ی «روایتگری» را برای ابزارهای مانیتورینگ طراحی کرد. این سیستم با تبدیل داده‌های خام به خلاصه‌های ساختاریافته، دقت…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

SDR و Ternary Compute؛ Nexuscortex سرعت استنتاج را ۷۳.۹ برابر افزایش داد

پروژه Nexuscortex با استفاده از معماری شناختی پراکنده در زبان Go، سرعت استنتاج را ۷۳.۹ برابر بیشتر از مدل‌های متراکم کرده است. این سیستم با الهام از علوم اعصاب، حافظه و یادگیری را…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه استریم لحظه‌ای مدل‌های زبانی را با کمتر از ۱۵۰ خط کد در Next.js بسازیم؟

پیاده‌سازی Server-Sent Events (SSE) در Next.js اجازه می‌دهد مدل‌های زبانی محلی در Ollama، توکن‌ها را کلمه به کلمه ارسال کنند. این روش تأخیر در نمایش متن را می‌گیرد و تجربه کاربری…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

حافظه یک میلیارد توکنی OpenHuman؛ تلاش برای تبدیل AI به سیستم‌عامل شخصی

OpenHuman یک دستیار بازمتن و محلی است که با حافظه یک میلیارد توکنی، نقش «مغز دوم» را برای کاربر ایفا می‌کند. این ابزار با حذف وابستگی به ابر، حریم خصوصی را تضمین کرده و به ۱۱۸…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

خودکارسازی استنتاج محلی با PowerShell و Local Foundry مایکروسافت

مایکروسافت با ابزار Local Foundry امکان اجرای مدل‌های هوش مصنوعی را روی شتاب‌دهنده‌های NPU فراهم کرده است. توسعه‌دهندگان اکنون می‌توانند مدیریت مدل‌ها و تولید پاسخ‌ها را از طریق…

۳ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

انتخاب مدل بردار معنایی؛ مرز میان دقت بازیابی و سقوط بودجه در RAG

انتخاب درست مدل بردار معنایی و متریک شباهت، تعیین‌کننده دقت جست‌وجوی معنایی و سیستم‌های RAG است. این راهنما توازن میان ابعاد بردار و پیش‌پردازش داده‌ها برای بهینه‌سازی بازیابی را…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

سازوکار RAG: مهار توهمات هوش مصنوعی با بهینه‌سازی خط لوله داده

تولید بازیابی‌افزا (RAG) با اتصال مدل‌های زبانی به داده‌های خصوصی و به‌روز، مشکل توهم و تاریخ انقضای دانش را حل می‌کند. در این معماری، تمرکز مهندسی از طراحی پرامپت به بهینه‌سازی…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

۳.۴۷ دلار هزینه API و ۴۷ ساعت صرفه‌جویی: سازوکار جدید اتوماسیون تیکت‌ها

یک توسعه‌دهنده با استفاده از OpenRouter و Node.js سیستمی برای پردازش تیکت‌های مشتریان طراحی کرد که هزینه‌های API را ۶۸٪ کاهش داد. این معماری سبک توانست در سه هفته ۴۷ ساعت از زمان…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

سازوکار KVarN برای افزایش ۵ برابری ظرفیت حافظه در vLLM بدون افت سرعت

KVarN با حذف تضاد سنتی میان سرعت و دقت، ظرفیت حافظه KV-cache را ۳ تا ۵ برابر افزایش می‌دهد. این ابزار جدید اجازه می‌دهد مدل‌ها بافت‌های بسیار طولانی‌تر را بدون کاهش سرعت استنتاج…

۳ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

گزارش Artificial Analysis: تأخیر Nemotron 3.5 انویدیا به ۰.۰۷ ثانیه رسید

انویدیا مدل Nemotron 3.5 ASR را با ۶۰۰ میلیون پارامتر معرفی کرد که تبدیل گفتار به متن را برای ۴۰ زبان در لحظه انجام می‌دهد. این مدل با معماری جدید خود، تضاد میان سرعت و دقت را از…

۲ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

پلتفرم متن‌باز OpenJarvis از دانشگاه استنفورد و آزمایشگاه‌های Lambda، امکان اجرای عامل‌های هوش مصنوعی را به‌صورت کاملاً محلی فراهم می‌کند. این سیستم با دقت نزدیک به مدل‌های ابری،…

۳ دقیقه خواندن