
«برتری مدلهای کوچک»، رویکرد جدید در مقابله با حملات سایبری
صنعت امنیت سایبری از مدلهای عمومی به سمت مدلهای زبانی کوچک (SLM) و تخصصی حرکت میکند. این تغییر رویکرد، شناسایی تهدیدات در لحظه را ممکن کرده و همزمان حریم خصوصی دادههای حساس را…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۶ مقاله منتشر شده

صنعت امنیت سایبری از مدلهای عمومی به سمت مدلهای زبانی کوچک (SLM) و تخصصی حرکت میکند. این تغییر رویکرد، شناسایی تهدیدات در لحظه را ممکن کرده و همزمان حریم خصوصی دادههای حساس را…

پژوهشگران Sina Weibo مدل VibeThinker-3B را معرفی کردند؛ یک مدل استدلالی کوچک که در وظایف ریاضی و کدنویسی با مدلهای عظیمی چون DeepSeek V3.2 رقابت میکند. این مدل با استفاده از خط…

انویدیا چارچوب SpatialClaw را معرفی کرد که بهجای فراخوانیهای صلب ابزار، از کد پایتون بهعنوان رابط اقدام استفاده میکند. این رویکرد باعث شد مدلهای بینایی-زبانی بدون نیاز به…

موتور متنباز TokenCircuit با شناسایی خطاهای منطقی و متوقف کردن حلقههای تکراری در عاملهای هوش مصنوعی، از اتلاف هزینههای API و از دست رفتن دادهها جلوگیری میکند. این ابزار با…

پلتفرم متنباز DepthSight با ارائه ابزاری برای میزبانی شخصی (Self-hosting)، کنترل کامل دادههای حساس را به معاملهگران بازمیگرداند. این سیستم با جایگزینی باتهای متمرکز با یک…

بسیاری از پروژههای هوش مصنوعی بهدلیل انتخاب نادرست روش انتقال دانش شکست میخورند. این راهنما معیارهای تصمیمگیری میان سه استراتژی اصلی برای بهینهسازی هزینه، دقت و مقیاسپذیری…

پلتفرم Oxlo.ai مدل قیمتگذاری مبتنی بر توکن را با مدل «درخواستمحور» جایگزین کرد تا هزینههای عملیاتی در گردشهای کاری پیچیده پیشبینیپذیر شود. این رویکرد تفاوت میان هزینه پردازش…

پژوهشی جدید در AIS2C2 ۲۰۲۵ چارچوبی را معرفی میکند که به مدلهای زبانی کوچک و بازمتن اجازه میدهد از طریق پرامپتهای ساختاریافته از ابزارهای خارجی استفاده کنند. این روش نیاز به…

استودیوی Rendereel تأکید میکند که خروجیهای باکیفیت در ویدیوهای هوش مصنوعی دیگر با ابزارهای عمومی ممکن نیست. برای عبور از سقف کیفی آماتورها، استفاده از مدلهای لورا (LoRA) برای…

کارمند سابق OpenAI ابزاری را معرفی کردند که میزان تثبیت نام و هویت افراد در وزنهای مدلهای زبانی بزرگ را اندازهگیری میکند. این سامانه نشان میدهد که آیا یک مدل، شما را به…

پلتفرم Neural Inverse Cloud با معرفی یک IDE ابری، محدودیتهای دسترسی به مدلهای هوش مصنوعی را از طریق مسیریابی درخواستها بر اساس پیچیدگی وظایف برطرف کرده است. این سیستم بهجای…

انویدیا مدل Nemotron 3 Ultra را معرفی کرد که برخلاف مدلهای پیشرو، نه تنها وزنها، بلکه دادههای آموزشی و متدهای ساخت را نیز بهصورت باز منتشر کرده است. این مدل با معماری ترکیبی،…