تحلیل و بررسی تخصصی

استخراج آرگومان‌های ریاضی از فعال‌سازهای Llama بدون تحلیل متن

پژوهشگران ثابت کردند که عملیات و اعداد ریاضی را می‌توان مستقیماً از فعال‌سازهای داخلی مدل‌های Llama استخراج کرد. این دستاورد اجازه می‌دهد ابزارهای خارجی به‌جای تحلیل متنی پرامپت،…

۹ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

حذف تأخیر در رابط کاربری: راهنمای استریمینگ Gemini 2.0 Flash با Rust و Tauri

یک راهنمای فنی جدید نشان می‌دهد چگونه با ترکیب Rust و Tauri می‌توان پاسخ‌های Gemini را به‌صورت استریمینگ نمایش داد. این روش با استفاده از SSE، زمان انتظار کاربر را حذف کرده و…

۳ دقیقه خواندن۲

آموزش کاربردی۳ هفته پیش

حد ۴,۰۰۰ توکنی در macOS 0.30.6: چرا مدل Qwen3 باعث کرش Metal GPU می‌شود؟

یک پس‌رفت فنی در macOS 0.30.6 باعث کرش مدل qwen3-embedding هنگام پردازش متن‌های طولانی می‌شود. برای رفع این مشکل، کاربران باید به نسخه 0.24.0 بازگردند یا ورودی‌ها را تکه‌تکه کنند.

۱ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا مدل‌های بزرگ در Ollama 0.30 روی کارت‌های ۴ گیگابایتی کرش می‌کنند؟

نسخه ۰.۳۰.x ابزار Ollama به دلیل مدیریت تهاجمی حافظه Vulkan، باعث خطای کمبود حافظه (OOM) در کارت‌های گرافیکی ۴ گیگابایتی شده است. این مشکل دسترسی به مدل‌های کوانتیزه شده را مختل…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

آیا «پرتاب» مدل‌های فوق-پارامتری مشکل تعمیم‌پذیری هوش مصنوعی را حل می‌کند؟

یک پیشنهاد نظری جدید ادعا می‌کند که دستیابی به هوش سطح انسانی نیازمند «پرتاب» (Catapulting) مدل‌های بسیار بزرگ از طریق چرخه‌های نرخ یادگیری بالاست. این رویکرد، اولویت را از حجم…

۱۰ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

NVIDIA Garak: تبدیل حفره‌های امنیتی LLM به نمرات عددی و قابل اندازه‌گیری

ابزار Garak از شرکت NVIDIA فرآیند تست نفوذ یا همان Red-teaming را برای مدل‌های زبانی خودکار می‌کند. این چارچوب با جایگزینی تست‌های دستی با معیارهای عددی، به توسعه‌دهندگان اجازه…

۶ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه عامل‌های هوش مصنوعی ۸۰ درصد کد تولیدی Anthropic را به دست گرفتند؟

شرکت Anthropic گزارش داد که مدل Claude اکنون بخش اعظم کدهای محیط تولید را می‌نویسد و دیگر صرفاً یک دستیار نیست. این چرخش، سرعت پیاده‌سازی پروژه‌ها را ۸ برابر کرده و بازه زمانی…

۹ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه ترکیب جستجوی ترکیبی و RAGAS توهمات را در AI حقوقی حذف می‌کند؟

یک معماری جدید برای هوش مصنوعی حقوقی، جستجوی برداری ساده را با سیستم بازیابی ترکیبی و ارزیابی برنامه‌ریزی‌شده جایگزین کرده است. این روش توهمات را حذف کرده و استنادات دقیق به اسناد…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

افزایش ۱۰,۰۰۰ برابری سرعت محاسبات نمادین با Symbolica 2.0

نسخه ۲.۰ کتابخانه Symbolica با معرفی «نمادهای برنامه‌پذیر» و کامپایل JIT، سرعت پردازش‌های ریاضی پیچیده را تا ۱۰ هزار برابر افزایش داده است. این به‌روزرسانی با ارائه دقت ۳۱ رقم…

۱۱ دقیقه خواندن

داستان‌ها و مصاحبه‌ها۳ هفته پیش

چگونه Scarab تضادهای کدنویسی AI را پیش از تبدیل شدن به باگ شناسایی می‌کند؟

مجموعه تشخیصی Scarab فرآیند دیباگ در هوش مصنوعی را از تعمیر واکنشی به پیشگیری فعال تغییر می‌دهد. این ابزار «تزلزل حقیقت نرم‌افزاری» را در لحظه شناسایی کرده و مانع انباشت بدهی فنی…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا تکیه بر تاریخچهٔ گفتگو در حافظه‌ی عامل‌های هوش مصنوعی شکست می‌خورد؟

اعتماد صرف به تاریخچهٔ گفتگو برای ایجاد حافظه در عامل‌های هوش مصنوعی به‌دلیل محدودیت‌های استدلالی مدل‌ها ناکارآمد است. راهکار جایگزین، استقرار یک معماری سه‌لایه شامل حافظه…

۷ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه «تراشیدن بافت» حافظه، نویز عامل‌های هوش مصنوعی را پاکسازی می‌کند؟

یک الگوی مهندسی جدید به مدل‌های بزرگ اجازه می‌دهد تا حافظه‌ی مدل‌های کوچک‌تر را به‌صورت پویا ویرایش و بازنویسی کنند. این روش نویز را حذف و دقت را بالا می‌برد، اما ریسک افزایش شدید…

۹ دقیقه خواندن