پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غول‌ها پیروز می‌شود
آموزش کاربردی

امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غول‌ها پیروز می‌شود

مدل CyberSecQwen-4B با وجود اندازه کوچک‌تر، در تحلیل تهدیدات سایبری مدل‌های ۸ میلیاردی را شکست داد. این دستاورد به تحلیل‌گران اجازه می‌دهد داده‌های حساس را بدون ریسک نشت اطلاعات،…

۲ دقیقه خواندن
ترفند جدید انویدیا برای تبدیل مدل‌های کوچک به برنامه‌نویسان حرفه‌ای Bash
آموزش کاربردی

ترفند جدید انویدیا برای تبدیل مدل‌های کوچک به برنامه‌نویسان حرفه‌ای Bash

پژوهشگران انویدیا با استفاده از رمزگشایی محدود به گرامر، دقت مدل‌های زبانی کوچک را در تولید دستورات Bash به ۷۵ درصد رساندند. این دستاورد یعنی مدل‌های بسیار کوچک حالا می‌توانند…

۳ دقیقه خواندن
چگونه OpenOSINT تحقیقات جاسوسی دیجیتال را به یک دستور ساده تبدیل کرد؟
آموزش کاربردی

چگونه OpenOSINT تحقیقات جاسوسی دیجیتال را به یک دستور ساده تبدیل کرد؟

OpenOSINT یک عامل هوشمند است که فرآیند خسته‌کننده‌ی جابه‌جایی بین ابزارهای جاسوسی منابع باز را حذف می‌کند. این ابزار با استفاده از یک حلقه‌ی استدلالی پویا، اجازه می‌دهد تحقیقات…

۲ دقیقه خواندن
چرا برای ساخت مدل‌های دقیق‌تر، باید کمتر کد بنویسیم؟

چرا برای ساخت مدل‌های دقیق‌تر، باید کمتر کد بنویسیم؟

پژوهشگران روشی را ابداع کرده‌اند که در آن مدل‌های زبانی به‌جای بازنویسی کامل معماری‌های عصبی، تنها تغییرات ضروری (Diffs) را اعمال می‌کنند. این رویکرد طول خروجی را تا ۸۵٪ کاهش داده…

۲ دقیقه خواندن
رمزگشایی از Hybrid-DPO: ضربه‌ای مهلک به توهمات منطقی مدل‌های زبانی

رمزگشایی از Hybrid-DPO: ضربه‌ای مهلک به توهمات منطقی مدل‌های زبانی

چارچوب RLearner-LLM با معرفی Hybrid-DPO، «سوگیری پرحرفی» را هدف قرار داده تا مدل‌ها به جای فصاحت، بر درستی منطقی تمرکز کنند. این روش باعث بهبود ۶ برابری در مبنی‌سازی منطقی مدل‌ها…

۲ دقیقه خواندن
افشای شکاف استدلالی؛ مدل‌های متن‌باز در برابر آزمون DiffCap-Bench شکست خوردند

افشای شکاف استدلالی؛ مدل‌های متن‌باز در برابر آزمون DiffCap-Bench شکست خوردند

معرفی بنچ‌مارک DiffCap-Bench نشان داد که مدل‌های تجاری در درک تفاوت‌های بصری، فرسنگ‌ها از مدل‌های متن‌باز جلوترند. این یافته ثابت می‌کند که صرفاً بزرگ‌تر کردن مدل‌ها، مشکل استدلال…

۲ دقیقه خواندن
چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

پژوهشگران با معرفی LongSeeker، پارادایم جدیدی برای مدیریت حافظه در عامل‌های جستجو ایجاد کرده‌اند. این مدل با حذف داده‌های زائد، دقت جستجوهای پیچیده را به ۶۲.۵٪ رسانده و رقبای…

۲ دقیقه خواندن