
دیپسیک-V4: هزینه استنتاج یک میلیون توکن به ۲۷ درصد نسخه V3.2 رسید
مدل DeepSeek-V4 با معرفی معماری Hybrid Attention، هزینه محاسباتی استنتاج در پنجرههای متنی یک میلیون توکنی را بهشدت کاهش داد. این مدل با تمرکز بر بهینهسازی عاملهای خودکار،…
دستهبندی
راهنماهای گامبهگام، دورهها و آموزشهای کاربردی استفاده از هوش مصنوعی — از مهندسی پرامپت تا فاینتیون و RAG.
۱٬۸۶۲ مقاله منتشر شده

مدل DeepSeek-V4 با معرفی معماری Hybrid Attention، هزینه محاسباتی استنتاج در پنجرههای متنی یک میلیون توکنی را بهشدت کاهش داد. این مدل با تمرکز بر بهینهسازی عاملهای خودکار،…

پلتفرم Genkit یک لایهی میانی (Middleware) برای خودکارسازی بازپخشها و امنیت ابزارها معرفی کرد. این قابلیت به توسعهدهندگان اجازه میدهد بدون نوشتن کدهای تکراری، مدیریت خطاهای مدل…

یک افزونه جدید برای Claude Code و Codex با استفاده از علوم شناختی، از فراموشی مهارتهای فنی برنامهنویسان در مواجهه با هوش مصنوعی جلوگیری میکند. این ابزار جلسات سریع کدنویسی را…

مدل Claude 4.6 در کدنویسی و استدلالهای پیچیده پیشتاست، در حالی که GPT-5.4 در ابزارهای اکوسیستمی برتری دارد. برنامهنویسان اکنون بهجای جستوجوی یک مدل «بهترین»، از استراتژی…

پژوهشکده Nous Research روشی به نام آموزش برهمنهی توکنها (TST) را معرفی کرده که سرعت پیشآموزش مدلهای زبانی بزرگ را تا ۲.۵ برابر افزایش میدهد. این متد با پردازش دستهای توکنها…

داکر ابزار Sandbox را برای عاملهای هوش مصنوعی معرفی کرد که با استفاده از microVMها، محیط اجرا را از سیستم میزبان جدا میکند. این قابلیت با حذف نیاز به تأیید دستی هر دستور، سرعت…

بسیاری از پروژههای هوش مصنوعی سازمانی به دلیل ناتوانی مدلهای تکمنظوره در مدیریت گردشکارهای پیچیده، در مرحله تولید شکست میخورند. سیستمهای چندعاملی (MAS) با جایگزینی یک مدل…

مدل HERMES++ با ادغام درک سهبعدی صحنه و پیشبینی مسیر در یک شبکه واحد، دقت پیشبینی هندسهی جاده را بهطور چشمگیری افزایش داده است. این مدل برخلاف ابزارهای تخصصی پیشین، اجازه…

یک سامانه ردیابی جدید با تحلیل تاریخچه امتیازات LMSYS Arena، کاهش پنهان کیفیت مدلهای برتر هوش مصنوعی را افشا کرد. این پدیده که «نرفینگ» نامیده میشود، اغلب نتیجهی سختگیرانهتر…

OpenHuman یک عامل هوش مصنوعی متنباز و محلی است که با استفاده از «درخت حافظه» و لایهی فشردهسازی، هزینههای API را تا ۸۰٪ کاهش میدهد. این ابزار با اولویت دادن به حریم خصوصی،…

یک توسعهدهنده با پیادهسازی لایه پروکسی برای استانداردسازی درخواستها، هزینههای استنتاج مدلهای زبانی را ۴۰٪ کاهش و ظرفیت پذیرش را ۵ برابر کرد. این متد با استفاده از نقاط…

پروژه Rotunda مرورگری مخصوص عاملهای هوش مصنوعی است که به جای تغییر شناسهی دستگاه، رفتارهای انسانی را شبیهسازی میکند. این ابزار با ادغام در Playwright، امکان وبگردی بدون فعال…