موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۵ مقاله منتشر شده

گزارش arxiv.org: شکست کامل SafeLoRA در برابر استاندارد چهارگانه Acceptance Cards

پژوهشگران پروتکل سخت‌گیرانه Acceptance Cards را برای تأیید دفاع‌های تنظیم دقیق معرفی کردند. نتایج اولیه نشان می‌دهد SafeLoRA در مدل Gemma-2-2B-it شکست خورده و ادعاهای ایمنی فعلی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا مدل ۰.۷۷ میلیارد پارامتری Fashion Florence از GPT-4o-mini دقیق‌تر است؟

یک مدل تخصصی با نام Fashion Florence با تنها ۰.۷۷ میلیارد پارامتر، در استخراج داده‌های ساختاریافته‌ی مد از تصاویر، مدل‌های پیشرویی چون GPT-4o-mini را شکست داد. این دستاورد نشان…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

درون LLARS: سیستمی برای تبدیل شهود متخصصان به بنچمارک‌های دقیق هوش مصنوعی

پلتفرم بازمتن LLARS با یکپارچه‌سازی مهندسی پرامپت و ارزیابی، شکاف ارتباطی میان متخصصان دامنه و توسعه‌دهندگان را پر می‌کند. این سیستم یک گردش‌کار سرتاسری برای ساخت مدل‌های زبانی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از اثر Harness: عاملی که ارزش‌های مدل‌های زبانی را تغییر می‌دهد

پژوهشگران با معرفی Agent-ValueBench نشان دادند که رفتار عامل‌های هوش مصنوعی لزوماً با ارزش‌های مدل زبانی زیرساختی آن‌ها هم‌راستا نیست. این یافته‌ها ثابت می‌کند که ایمنی در…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

افزایش ۱۳.۳۴ درصدی دقت استدلال ریاضی در AIME ۲۰۲۵ با چارچوب EXPO

چارچوب بهینه‌سازی جدیدی به نام EXPO با جایگزینی جریمه‌های ثابت KL و نمونه‌برداری یکنواخت، توانست عملکرد مدل‌های Qwen در استدلال ریاضی را به‌طور چشمگیری ارتقا دهد. این دستاورد نشان…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

سازوکار M2A: تزریق استدلال ریاضی به عامل‌های هوش مصنوعی بدون آموزش مجدد

رویکرد جدید M2A با ادغام پارامترها در فضای تهی، توانایی استدلال ریاضی را به عامل‌های هوش مصنوعی تزریق می‌کند بدون آنکه نیاز به آموزش مجدد باشد. این متد نرخ حل مسائل SWE-Bench در…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چرا برای اتصال عامل‌های هوش مصنوعی به ایمیل، SMTP ساده دیگر کافی نیست؟

شرکت Mnexa-AI ابزار e2a را معرفی کرد؛ گیت‌ویی امن که امکان ارسال و دریافت ایمیل با هویت تأییدشده را برای عامل‌های هوش مصنوعی فراهم می‌کند. این سیستم با ترکیب امضاهای HMAC و نظارت…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چگونه ترکیب کد قطعی و مدل زبانی، تحلیل امکان‌سنجی CNC را به ۴۰ ثانیه رساند؟

سیستم MachinaCheck با استفاده از مدل‌های محلی، تحلیل فایل‌های CAD برای تولید CNC را از ۲۰ ساعت در هفته به ۴۰ ثانیه کاهش داده است. این راهکار با اجرای مدل Qwen روی سخت‌افزار AMD،…

۳ دقیقه خواندن

اخبار کوتاه روزانه۲ ماه پیش

گزارش OpenRouter: پیشتازی Hermes Agent با ۲۲۴ میلیارد توکن روزانه

عامل Hermes Agent با پیشی گرفتن از OpenClaw، به پرکاربردترین عامل متن‌باز در OpenRouter تبدیل شد. این تغییر نشان‌دهنده چرخش استراتژیک توسعه‌دهندگان از ابزارهای «پراکنده» به سمت…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

ساخت داور تعصبات با Gemma 4: هزینه ۳۰ دلاری در برابر دقت API

یک توسعه‌دهنده با هزینه کمتر از ۳۰ دلار، مدلی تخصصی برای ارزیابی تعصبات اجتماعی بر پایه Gemma 4 ساخت. این پروژه نشان می‌دهد که کیفیت داده‌ها بر تنظیمات فنی اولویت دارد، اما…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چگونه OncoAgent با معماری دو لایه، استقرار محلی AI در سرطان‌شناسی را ممکن کرد؟

OncoAgent یک چارچوب متن‌باز برای پشتیبانی از تصمیمات سرطان‌شناسی است که به‌طور کامل در محیط داخلی (On-premises) اجرا می‌شود تا حریم خصوصی بیماران را تضمین کند. این سیستم با…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غول‌ها پیروز می‌شود

مدل CyberSecQwen-4B با وجود اندازه کوچک‌تر، در تحلیل تهدیدات سایبری مدل‌های ۸ میلیاردی را شکست داد. این دستاورد به تحلیل‌گران اجازه می‌دهد داده‌های حساس را بدون ریسک نشت اطلاعات،…

۲ دقیقه خواندن