
درون prime-rl 0.6.0؛ سازوکار آموزش مدلهای عظیم ترکیب خبرهها
شرکت Prime Intellect چارچوب متنباز prime-rl 0.6.0 را برای یادگیری تقویتی مدلهای ترکیب خبرهها (MoE) با مقیاس تریلیون پارامتر منتشر کرد. این سیستم با جداسازی زیرساخت آموزش و…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۳۹ مقاله منتشر شده

شرکت Prime Intellect چارچوب متنباز prime-rl 0.6.0 را برای یادگیری تقویتی مدلهای ترکیب خبرهها (MoE) با مقیاس تریلیون پارامتر منتشر کرد. این سیستم با جداسازی زیرساخت آموزش و…

تیم OpenClaw سیستمی را معرفی کرد که با استفاده از مدلهای محلی متوسط، جایگزین APIهای گرانقیمت برای طبقهبندی خودکار مسائل و PRهای گیتهاب شده است. این رویکرد با ترکیب ابزارهای…

مدل Claude از معماری ترنسفورمر و چارچوب منحصربهفرد «هوش مصنوعی قانونمدار» برای ایجاد تعادل میان توانمندی بالا و ایمنی اخلاقی استفاده میکند. این رویکرد برخلاف روشهای سنتی، بر…

مدل جدید ۷۴۴ میلیارد پارامتری Zhipu AI در بنچمارکهای کدنویسی از رقبای آمریکایی پیشی گرفت. بنیانگذار این شرکت ادعا میکند چین تا پایان ۲۰۲۶ به تواناییهای مدل Fable 5 دست مییابد.

بسیاری از شرکتها در حال گذار از هوش مصنوعی گفتگو-محور به «عاملهای مدیریتشده» هستند که فرآیندهای تجاری چندمرحلهای را اجرا میکنند. تمرکز صنعت اکنون از ارائه پاسخهای متنی به…

ابزار Runcap با معرفی تخمین هزینه پیشپرواز و توقفهای سخت، مانع از تحلیل رفتن بودجههای توسعهدهندگان در حلقههای تکراری عاملها میشود. این سرویس برخلاف ابزارهای نظارتی، هزینه…

پروژه Dhi الگویی جامع برای ساخت محیط توسعه (IDE) مبتنی بر هوش مصنوعی ارائه میدهد که تماماً از ابزارهای متنباز استفاده میکند. این سیستم با ادغام مدلهای محلی و لایههای…

مدل GLM-5.2 با وجود قیمت پایینتر بهازای هر توکن، بهدلیل تولید حجم بالای توکنهای استدلالی داخلی، تنها ۳۰ تا ۳۵ درصد ارزانتر از رقبا تمام میشود. این تفاوت نشان میدهد که کاهش…

یک پروژه شبیهسازی شده نشان میدهد که یادگیری تقویتی عمیق چگونه میتواند تجارت باتریهای صنعتی را با پیشبینی جهشهای قیمتی بهینه کند. این سیستم با یادگیری روابط علی میان تقاضای…

پایش امنیتی بیش از ۱۱۷ هزار مهارت در عاملهای هوش مصنوعی نشان میدهد ۳.۱٪ از ابزارهای بررسیشده ناامناند و ۸۲٪ آنها هنوز هیچ بازرسی امنیتی نداشتهاند. این گزارش هشدار میدهد که…

پلتفرم Invoance ابزاری برای ثبت سوابق تغییرناپذیر از ورودیها و خروجیهای مدلهای هوش مصنوعی معرفی کرد. این سامانه با استفاده از امضاهای دیجیتال، امکان اثبات دقیق پاسخهای مدل را…

عامل هوشمند MelodicMind معماری جدیدی برای جایگزینی کیوریتوری دستی اخبار با یک خط لوله خودکار معرفی کرد. این سیستم با استفاده از جستوجوی معنایی، نویز دادهها را حذف کرده و اطلاعات…