
استخراج آرگومانهای ریاضی از فعالسازهای Llama بدون تحلیل متن
پژوهشگران ثابت کردند که عملیات و اعداد ریاضی را میتوان مستقیماً از فعالسازهای داخلی مدلهای Llama استخراج کرد. این دستاورد اجازه میدهد ابزارهای خارجی بهجای تحلیل متنی پرامپت،…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۷۹ مقاله منتشر شده

پژوهشگران ثابت کردند که عملیات و اعداد ریاضی را میتوان مستقیماً از فعالسازهای داخلی مدلهای Llama استخراج کرد. این دستاورد اجازه میدهد ابزارهای خارجی بهجای تحلیل متنی پرامپت،…

یک راهنمای فنی جدید نشان میدهد چگونه با ترکیب Rust و Tauri میتوان پاسخهای Gemini را بهصورت استریمینگ نمایش داد. این روش با استفاده از SSE، زمان انتظار کاربر را حذف کرده و…

یک پسرفت فنی در macOS 0.30.6 باعث کرش مدل qwen3-embedding هنگام پردازش متنهای طولانی میشود. برای رفع این مشکل، کاربران باید به نسخه 0.24.0 بازگردند یا ورودیها را تکهتکه کنند.

نسخه ۰.۳۰.x ابزار Ollama به دلیل مدیریت تهاجمی حافظه Vulkan، باعث خطای کمبود حافظه (OOM) در کارتهای گرافیکی ۴ گیگابایتی شده است. این مشکل دسترسی به مدلهای کوانتیزه شده را مختل…

یک پیشنهاد نظری جدید ادعا میکند که دستیابی به هوش سطح انسانی نیازمند «پرتاب» (Catapulting) مدلهای بسیار بزرگ از طریق چرخههای نرخ یادگیری بالاست. این رویکرد، اولویت را از حجم…

ابزار Garak از شرکت NVIDIA فرآیند تست نفوذ یا همان Red-teaming را برای مدلهای زبانی خودکار میکند. این چارچوب با جایگزینی تستهای دستی با معیارهای عددی، به توسعهدهندگان اجازه…

شرکت Anthropic گزارش داد که مدل Claude اکنون بخش اعظم کدهای محیط تولید را مینویسد و دیگر صرفاً یک دستیار نیست. این چرخش، سرعت پیادهسازی پروژهها را ۸ برابر کرده و بازه زمانی…

یک معماری جدید برای هوش مصنوعی حقوقی، جستجوی برداری ساده را با سیستم بازیابی ترکیبی و ارزیابی برنامهریزیشده جایگزین کرده است. این روش توهمات را حذف کرده و استنادات دقیق به اسناد…

نسخه ۲.۰ کتابخانه Symbolica با معرفی «نمادهای برنامهپذیر» و کامپایل JIT، سرعت پردازشهای ریاضی پیچیده را تا ۱۰ هزار برابر افزایش داده است. این بهروزرسانی با ارائه دقت ۳۱ رقم…

مجموعه تشخیصی Scarab فرآیند دیباگ در هوش مصنوعی را از تعمیر واکنشی به پیشگیری فعال تغییر میدهد. این ابزار «تزلزل حقیقت نرمافزاری» را در لحظه شناسایی کرده و مانع انباشت بدهی فنی…

اعتماد صرف به تاریخچهٔ گفتگو برای ایجاد حافظه در عاملهای هوش مصنوعی بهدلیل محدودیتهای استدلالی مدلها ناکارآمد است. راهکار جایگزین، استقرار یک معماری سهلایه شامل حافظه…

یک الگوی مهندسی جدید به مدلهای بزرگ اجازه میدهد تا حافظهی مدلهای کوچکتر را بهصورت پویا ویرایش و بازنویسی کنند. این روش نویز را حذف و دقت را بالا میبرد، اما ریسک افزایش شدید…