پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۵ مقاله منتشر شده

درون LLARS: سیستمی برای تبدیل شهود متخصصان به بنچمارک‌های دقیق هوش مصنوعی

درون LLARS: سیستمی برای تبدیل شهود متخصصان به بنچمارک‌های دقیق هوش مصنوعی

پلتفرم بازمتن LLARS با یکپارچه‌سازی مهندسی پرامپت و ارزیابی، شکاف ارتباطی میان متخصصان دامنه و توسعه‌دهندگان را پر می‌کند. این سیستم یک گردش‌کار سرتاسری برای ساخت مدل‌های زبانی…

۲ دقیقه خواندن
رمزگشایی از اثر Harness: عاملی که ارزش‌های مدل‌های زبانی را تغییر می‌دهد

رمزگشایی از اثر Harness: عاملی که ارزش‌های مدل‌های زبانی را تغییر می‌دهد

پژوهشگران با معرفی Agent-ValueBench نشان دادند که رفتار عامل‌های هوش مصنوعی لزوماً با ارزش‌های مدل زبانی زیرساختی آن‌ها هم‌راستا نیست. این یافته‌ها ثابت می‌کند که ایمنی در…

۲ دقیقه خواندن
افزایش ۱۳.۳۴ درصدی دقت استدلال ریاضی در AIME ۲۰۲۵ با چارچوب EXPO

افزایش ۱۳.۳۴ درصدی دقت استدلال ریاضی در AIME ۲۰۲۵ با چارچوب EXPO

چارچوب بهینه‌سازی جدیدی به نام EXPO با جایگزینی جریمه‌های ثابت KL و نمونه‌برداری یکنواخت، توانست عملکرد مدل‌های Qwen در استدلال ریاضی را به‌طور چشمگیری ارتقا دهد. این دستاورد نشان…

۲ دقیقه خواندن
سازوکار M2A: تزریق استدلال ریاضی به عامل‌های هوش مصنوعی بدون آموزش مجدد

سازوکار M2A: تزریق استدلال ریاضی به عامل‌های هوش مصنوعی بدون آموزش مجدد

رویکرد جدید M2A با ادغام پارامترها در فضای تهی، توانایی استدلال ریاضی را به عامل‌های هوش مصنوعی تزریق می‌کند بدون آنکه نیاز به آموزش مجدد باشد. این متد نرخ حل مسائل SWE-Bench در…

۲ دقیقه خواندن
چرا برای اتصال عامل‌های هوش مصنوعی به ایمیل، SMTP ساده دیگر کافی نیست؟
آموزش کاربردی

چرا برای اتصال عامل‌های هوش مصنوعی به ایمیل، SMTP ساده دیگر کافی نیست؟

شرکت Mnexa-AI ابزار e2a را معرفی کرد؛ گیت‌ویی امن که امکان ارسال و دریافت ایمیل با هویت تأییدشده را برای عامل‌های هوش مصنوعی فراهم می‌کند. این سیستم با ترکیب امضاهای HMAC و نظارت…

۳ دقیقه خواندن
چگونه ترکیب کد قطعی و مدل زبانی، تحلیل امکان‌سنجی CNC را به ۴۰ ثانیه رساند؟
آموزش کاربردی

چگونه ترکیب کد قطعی و مدل زبانی، تحلیل امکان‌سنجی CNC را به ۴۰ ثانیه رساند؟

سیستم MachinaCheck با استفاده از مدل‌های محلی، تحلیل فایل‌های CAD برای تولید CNC را از ۲۰ ساعت در هفته به ۴۰ ثانیه کاهش داده است. این راهکار با اجرای مدل Qwen روی سخت‌افزار AMD،…

۳ دقیقه خواندن
چگونه OncoAgent با معماری دو لایه، استقرار محلی AI در سرطان‌شناسی را ممکن کرد؟

چگونه OncoAgent با معماری دو لایه، استقرار محلی AI در سرطان‌شناسی را ممکن کرد؟

OncoAgent یک چارچوب متن‌باز برای پشتیبانی از تصمیمات سرطان‌شناسی است که به‌طور کامل در محیط داخلی (On-premises) اجرا می‌شود تا حریم خصوصی بیماران را تضمین کند. این سیستم با…

۳ دقیقه خواندن
امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غول‌ها پیروز می‌شود
آموزش کاربردی

امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غول‌ها پیروز می‌شود

مدل CyberSecQwen-4B با وجود اندازه کوچک‌تر، در تحلیل تهدیدات سایبری مدل‌های ۸ میلیاردی را شکست داد. این دستاورد به تحلیل‌گران اجازه می‌دهد داده‌های حساس را بدون ریسک نشت اطلاعات،…

۲ دقیقه خواندن