
امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غولها پیروز میشود
مدل CyberSecQwen-4B با وجود اندازه کوچکتر، در تحلیل تهدیدات سایبری مدلهای ۸ میلیاردی را شکست داد. این دستاورد به تحلیلگران اجازه میدهد دادههای حساس را بدون ریسک نشت اطلاعات،…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۶ مقاله منتشر شده

مدل CyberSecQwen-4B با وجود اندازه کوچکتر، در تحلیل تهدیدات سایبری مدلهای ۸ میلیاردی را شکست داد. این دستاورد به تحلیلگران اجازه میدهد دادههای حساس را بدون ریسک نشت اطلاعات،…

پژوهشگران انویدیا با استفاده از رمزگشایی محدود به گرامر، دقت مدلهای زبانی کوچک را در تولید دستورات Bash به ۷۵ درصد رساندند. این دستاورد یعنی مدلهای بسیار کوچک حالا میتوانند…

OpenOSINT یک عامل هوشمند است که فرآیند خستهکنندهی جابهجایی بین ابزارهای جاسوسی منابع باز را حذف میکند. این ابزار با استفاده از یک حلقهی استدلالی پویا، اجازه میدهد تحقیقات…

یک رابط جدید به نام ion7-core با استفاده از LuaJIT، مصرف حافظه مدلهای زبانی را به شدت کاهش داده است. این ابزار با حذف لایهی سنگین پایتون، امکان اجرای هوش مصنوعی را روی…

ترکیب مدل Gemma 4 31B با تکنولوژی پیشبینی چند-توکنی (MTP)، اجرای عاملهای هوشمند و پیچیده را روی سختافزارهای خانگی ممکن کرده است. این تحول به توسعهدهندگان اجازه میدهد بدون…

پروژه MedQA ثابت کرد که برای تنظیم دقیق مدلهای پزشکی، دیگر نیازی به سختافزارهای انویدیا نیست. این تیم با استفاده از تراشههای AMD و اکوسیستم ROCm، مدل Qwen3-1.7B را در تنها ۵…

پژوهشگران روشی را ابداع کردهاند که در آن مدلهای زبانی بهجای بازنویسی کامل معماریهای عصبی، تنها تغییرات ضروری (Diffs) را اعمال میکنند. این رویکرد طول خروجی را تا ۸۵٪ کاهش داده…

چارچوب RLearner-LLM با معرفی Hybrid-DPO، «سوگیری پرحرفی» را هدف قرار داده تا مدلها به جای فصاحت، بر درستی منطقی تمرکز کنند. این روش باعث بهبود ۶ برابری در مبنیسازی منطقی مدلها…

تیم RaguTeam با بهکارگیری یک مجموعه مدلهای متنوع، مقام اول مسابقات SemEval-2026 را به دست آورد. این سیستم با استفاده از GPT-4o-mini به عنوان داور، توانست در تولید پاسخهای…

معرفی بنچمارک DiffCap-Bench نشان داد که مدلهای تجاری در درک تفاوتهای بصری، فرسنگها از مدلهای متنباز جلوترند. این یافته ثابت میکند که صرفاً بزرگتر کردن مدلها، مشکل استدلال…

پژوهشگران با معرفی LongSeeker، پارادایم جدیدی برای مدیریت حافظه در عاملهای جستجو ایجاد کردهاند. این مدل با حذف دادههای زائد، دقت جستجوهای پیچیده را به ۶۲.۵٪ رسانده و رقبای…

پروژهی open-claude-design ثابت کرد که استفاده از «هارنسهای نازک» برای مدیریت ابزارهای موجود، بسیار کارآمدتر از ساخت عاملهای حجیم است. این سیستم با بازسازی خط لولهی ابزار طراحی…