پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

چرا VEXR Ultra برای تبدیل شدن به همکاری صادق‌تر، دستورات کاربر را رد می‌کند؟
آموزش کاربردی

چرا VEXR Ultra برای تبدیل شدن به همکاری صادق‌تر، دستورات کاربر را رد می‌کند؟

VEXR Ultra یک موتور استدلالی است که گاردریل‌های پنهان شرکتی را با یک قانون اساسی شفافِ ۳۴ ماده‌ای جایگزین کرده است. این مدل برخلاف هوش مصنوعی‌های سنتی، می‌تواند بدون ارائه دلیل از…

۲ دقیقه خواندن
چرا نباید داده‌های خام Prometheus را مستقیماً به مدل‌های زبانی داد؟
آموزش کاربردی

چرا نباید داده‌های خام Prometheus را مستقیماً به مدل‌های زبانی داد؟

برای جلوگیری از توهمات ریاضی و نشت داده‌ها، یک توسعه‌دهنده لایه‌ی «روایتگری» را برای ابزارهای مانیتورینگ طراحی کرد. این سیستم با تبدیل داده‌های خام به خلاصه‌های ساختاریافته، دقت…

۲ دقیقه خواندن
چگونه استریم لحظه‌ای مدل‌های زبانی را با کمتر از ۱۵۰ خط کد در Next.js بسازیم؟
آموزش کاربردی

چگونه استریم لحظه‌ای مدل‌های زبانی را با کمتر از ۱۵۰ خط کد در Next.js بسازیم؟

پیاده‌سازی Server-Sent Events (SSE) در Next.js اجازه می‌دهد مدل‌های زبانی محلی در Ollama، توکن‌ها را کلمه به کلمه ارسال کنند. این روش تأخیر در نمایش متن را می‌گیرد و تجربه کاربری…

۲ دقیقه خواندن
حافظه یک میلیارد توکنی OpenHuman؛ تلاش برای تبدیل AI به سیستم‌عامل شخصی
آموزش کاربردی

حافظه یک میلیارد توکنی OpenHuman؛ تلاش برای تبدیل AI به سیستم‌عامل شخصی

OpenHuman یک دستیار بازمتن و محلی است که با حافظه یک میلیارد توکنی، نقش «مغز دوم» را برای کاربر ایفا می‌کند. این ابزار با حذف وابستگی به ابر، حریم خصوصی را تضمین کرده و به ۱۱۸…

۲ دقیقه خواندن
انتخاب مدل بردار معنایی؛ مرز میان دقت بازیابی و سقوط بودجه در RAG
آموزش کاربردی

انتخاب مدل بردار معنایی؛ مرز میان دقت بازیابی و سقوط بودجه در RAG

انتخاب درست مدل بردار معنایی و متریک شباهت، تعیین‌کننده دقت جست‌وجوی معنایی و سیستم‌های RAG است. این راهنما توازن میان ابعاد بردار و پیش‌پردازش داده‌ها برای بهینه‌سازی بازیابی را…

۲ دقیقه خواندن
سازوکار RAG: مهار توهمات هوش مصنوعی با بهینه‌سازی خط لوله داده
آموزش کاربردی

سازوکار RAG: مهار توهمات هوش مصنوعی با بهینه‌سازی خط لوله داده

تولید بازیابی‌افزا (RAG) با اتصال مدل‌های زبانی به داده‌های خصوصی و به‌روز، مشکل توهم و تاریخ انقضای دانش را حل می‌کند. در این معماری، تمرکز مهندسی از طراحی پرامپت به بهینه‌سازی…

۲ دقیقه خواندن
۳.۴۷ دلار هزینه API و ۴۷ ساعت صرفه‌جویی: سازوکار جدید اتوماسیون تیکت‌ها
آموزش کاربردی

۳.۴۷ دلار هزینه API و ۴۷ ساعت صرفه‌جویی: سازوکار جدید اتوماسیون تیکت‌ها

یک توسعه‌دهنده با استفاده از OpenRouter و Node.js سیستمی برای پردازش تیکت‌های مشتریان طراحی کرد که هزینه‌های API را ۶۸٪ کاهش داد. این معماری سبک توانست در سه هفته ۴۷ ساعت از زمان…

۲ دقیقه خواندن
سازوکار KVarN برای افزایش ۵ برابری ظرفیت حافظه در vLLM بدون افت سرعت
آموزش کاربردی

سازوکار KVarN برای افزایش ۵ برابری ظرفیت حافظه در vLLM بدون افت سرعت

KVarN با حذف تضاد سنتی میان سرعت و دقت، ظرفیت حافظه KV-cache را ۳ تا ۵ برابر افزایش می‌دهد. این ابزار جدید اجازه می‌دهد مدل‌ها بافت‌های بسیار طولانی‌تر را بدون کاهش سرعت استنتاج…

۳ دقیقه خواندن
AI
آموزش کاربردی

چگونه OpenJarvis هزینه استنتاج عامل‌های هوش مصنوعی را ۸۰۰ برابر کاهش داد؟

پلتفرم متن‌باز OpenJarvis از دانشگاه استنفورد و آزمایشگاه‌های Lambda، امکان اجرای عامل‌های هوش مصنوعی را به‌صورت کاملاً محلی فراهم می‌کند. این سیستم با دقت نزدیک به مدل‌های ابری،…

۳ دقیقه خواندن