آموزش کاربردی | دات‌هوش

دیپ‌سیک-V4: هزینه استنتاج یک میلیون توکن به ۲۷ درصد نسخه V3.2 رسید

مدل DeepSeek-V4 با معرفی معماری Hybrid Attention، هزینه محاسباتی استنتاج در پنجره‌های متنی یک میلیون توکنی را به‌شدت کاهش داد. این مدل با تمرکز بر بهینه‌سازی عامل‌های خودکار،…

آموزش کاربردیماه گذشته

چگونه لایه‌ی میانی Genkit خطاهای استنتاج و امنیت ابزارها را مدیریت می‌کند؟

پلتفرم Genkit یک لایه‌ی میانی (Middleware) برای خودکارسازی بازپخش‌ها و امنیت ابزارها معرفی کرد. این قابلیت به توسعه‌دهندگان اجازه می‌دهد بدون نوشتن کدهای تکراری، مدیریت خطاهای مدل…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه «کتاب‌های درسی پویا» مانع از تحلیل مهارت‌های فنی برنامه‌نویسان می‌شوند؟

یک افزونه جدید برای Claude Code و Codex با استفاده از علوم شناختی، از فراموشی مهارت‌های فنی برنامه‌نویسان در مواجهه با هوش مصنوعی جلوگیری می‌کند. این ابزار جلسات سریع کدنویسی را…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

گزارش dev.to: برتری Claude 4.6 در کدنویسی پیچیده و استدلال‌های سطح دکترا

مدل Claude 4.6 در کدنویسی و استدلال‌های پیچیده پیشتاست، در حالی که GPT-5.4 در ابزارهای اکوسیستمی برتری دارد. برنامه‌نویسان اکنون به‌جای جست‌وجوی یک مدل «بهترین»، از استراتژی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصیماه گذشته

Nous Research: کاهش ۲.۵ برابری زمان پیش‌آموزش LLM بدون تغییر در معماری

پژوهشکده Nous Research روشی به نام آموزش برهم‌نهی توکن‌ها (TST) را معرفی کرده که سرعت پیش‌آموزش مدل‌های زبانی بزرگ را تا ۲.۵ برابر افزایش می‌دهد. این متد با پردازش دسته‌ای توکن‌ها…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

داکر: افزایش ۵۰ درصدی سرعت اجرای عامل‌های هوش مصنوعی با جداسازی microVM

داکر ابزار Sandbox را برای عامل‌های هوش مصنوعی معرفی کرد که با استفاده از microVMها، محیط اجرا را از سیستم میزبان جدا می‌کند. این قابلیت با حذف نیاز به تأیید دستی هر دستور، سرعت…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه سیستم‌های چندعاملی شکاف تولید هوش مصنوعی در سازمان‌ها را پر می‌کنند؟

بسیاری از پروژه‌های هوش مصنوعی سازمانی به دلیل ناتوانی مدل‌های تک‌منظوره در مدیریت گردش‌کارهای پیچیده، در مرحله تولید شکست می‌خورند. سیستم‌های چندعاملی (MAS) با جایگزینی یک مدل…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

HERMES++: کاهش ۴۱.۶ درصدی خطای پیش‌بینی مسیر در افق ۳ ثانیه‌ای

مدل HERMES++ با ادغام درک سه‌بعدی صحنه و پیش‌بینی مسیر در یک شبکه واحد، دقت پیش‌بینی هندسه‌ی جاده را به‌طور چشم‌گیری افزایش داده است. این مدل برخلاف ابزارهای تخصصی پیشین، اجازه…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

داده‌های LMSYS: افت پنهان عملکرد مدل‌های پرچم‌دار در سایه‌ی «نرفینگ»

یک سامانه ردیابی جدید با تحلیل تاریخچه امتیازات LMSYS Arena، کاهش پنهان کیفیت مدل‌های برتر هوش مصنوعی را افشا کرد. این پدیده که «نرفینگ» نامیده می‌شود، اغلب نتیجه‌ی سخت‌گیرانه‌تر…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

OpenHuman: کاهش ۸۰ درصدی هزینه‌های LLM با لایه‌ی فشرده‌سازی TokenJuice

OpenHuman یک عامل هوش مصنوعی متن‌باز و محلی است که با استفاده از «درخت حافظه» و لایه‌ی فشرده‌سازی، هزینه‌های API را تا ۸۰٪ کاهش می‌دهد. این ابزار با اولویت دادن به حریم خصوصی،…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

کاهش ۴۰ درصدی هزینه‌های استنتاج با استانداردسازی درخواست‌ها روی OpenAI

یک توسعه‌دهنده با پیاده‌سازی لایه پروکسی برای استانداردسازی درخواست‌ها، هزینه‌های استنتاج مدل‌های زبانی را ۴۰٪ کاهش و ظرفیت پذیرش را ۵ برابر کرد. این متد با استفاده از نقاط…

۲ دقیقه خواندن

آموزش کاربردیماه گذشته

چگونه Rotunda با جایگزینی «جعل هویت» با «رفتار انسانی» از سد کپچاها می‌گذرد؟

پروژه Rotunda مرورگری مخصوص عامل‌های هوش مصنوعی است که به جای تغییر شناسه‌ی دستگاه، رفتارهای انسانی را شبیه‌سازی می‌کند. این ابزار با ادغام در Playwright، امکان وب‌گردی بدون فعال…

۲ دقیقه خواندن