پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

چگونه «بومی‌سازی فرهنگی» نرخ موفقیت حملات به مدل‌های زبانی را ۹.۳٪ افزایش داد؟

چگونه «بومی‌سازی فرهنگی» نرخ موفقیت حملات به مدل‌های زبانی را ۹.۳٪ افزایش داد؟

ترجمهٔ مستقیم بنچمارک‌های ایمنی انگلیسی برای شناسایی آسیب‌پذیری‌های مدل‌های زبانی در محیط‌های آسیایی ناکارآمد است. مطالعه‌ای جدید ثابت می‌کند که رِد-تیمینگ متناسب با فرهنگ‌های…

۱ دقیقه خواندن
INFUSER: جایگزینی «سختی مسئله» با «امتیاز تأثیر» در آموزش مدل‌ها

INFUSER: جایگزینی «سختی مسئله» با «امتیاز تأثیر» در آموزش مدل‌ها

چارچوب جدیدی به نام INFUSER با تغییر رویکرد از داده‌های «سخت» به داده‌های «مؤثر»، مدل‌های هوش مصنوعی را قادر می‌سازد تا برنامه آموزشی خود را به‌طور پویا تکامل دهند. این متد باعث…

۲ دقیقه خواندن
چرا متد گرم‌بندی در مدل‌های بینایی-زبانی اثر نهایی RL را تغییر نمی‌دهد؟

چرا متد گرم‌بندی در مدل‌های بینایی-زبانی اثر نهایی RL را تغییر نمی‌دهد؟

یک مطالعه فنی روی مدل‌های بینایی-زبانی نشان می‌دهد که انتخاب بین SFT و OPD در مرحله گرم‌بندی، تنها بر رژیم آنتروپی اولیه اثر می‌گذارد و تأثیری بر عملکرد نهایی یادگیری تقویت‌شده…

۲ دقیقه خواندن
سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

پژوهشگران با توسعه‌ی خانواده‌ی مدل‌های NutriMLLM، توانسته‌اند ۶۵ ریزمغذی مختلف را از روی تصاویر غذا تخمین بزنند. این دستاورد از طریق تولید ۱.۱ میلیون تصویر مصنوعی بر اساس داده‌های…

۲ دقیقه خواندن
AliyunConsoleAgent: دستیابی به عملکرد مدل‌های پیشرو با ۹۲٪ هزینه کمتر

AliyunConsoleAgent: دستیابی به عملکرد مدل‌های پیشرو با ۹۲٪ هزینه کمتر

یک چارچوب آموزشی جدید با بهره‌گیری از تقطیر دانش و بهینه‌سازی GRPO، مدلی با ۳۲ میلیارد پارامتر را به سطح مدل‌های تجاری پیشرو در اتوماسیون کنسول‌های ابری رسانده است. این سیستم ضمن…

۲ دقیقه خواندن
توقف ویرایش‌های تصادفی AI در پروژه‌های بزرگ با معماری Sandbox در Plandex
آموزش کاربردی

توقف ویرایش‌های تصادفی AI در پروژه‌های بزرگ با معماری Sandbox در Plandex

Plandex یک عامل هوشمند متن‌باز و مبتنی بر ترمینال است که برای مدیریت تسک‌های پیچیده کدنویسی در چندین فایل طراحی شده است. این ابزار با ذخیره تغییرات در یک محیط ایزوله پیش از اعمال…

۶ دقیقه خواندن
چگونه SoloEngine خلأ بین کدنویسی پیچیده و ابزارهای ساده‌ی AI را پر می‌کند؟
آموزش کاربردی

چگونه SoloEngine خلأ بین کدنویسی پیچیده و ابزارهای ساده‌ی AI را پر می‌کند؟

شیائومی پلتفرم SoloEngine را معرفی کرد تا ساخت عامل‌های هوشمند بدون کدنویسی ممکن شود. این ابزار با استفاده از حلقه‌های ReAct، فاصله میان جریان‌های کاری صلب و چارچوب‌های پیچیده…

۵ دقیقه خواندن۲
ربات شیائومی MiMo با شعار اکتشاف و عشق

شیائومی: دستیابی به سرعت ۱۰۰۰ توکن در ثانیه برای مدل ۱ تریلیون پارامتری

شیائومی مدل MiMo-V2.5-Pro-UltraSpeed را معرفی کرد که روی GPUهای معمولی به سرعت ۱۰۰۰ توکن در ثانیه می‌رسد. این پیشرفت با ترکیب کوانتایزاسیون FP4 و رمزگشایی موازی-گمانه، گلوگاه‌های…

۷ دقیقه خواندن
چگونه ArcOS با کدنویسی قطعی، مانع از محو شدن شخصیت عامل‌های هوش مصنوعی می‌شود؟
آموزش کاربردی

چگونه ArcOS با کدنویسی قطعی، مانع از محو شدن شخصیت عامل‌های هوش مصنوعی می‌شود؟

هایجون ون، بنیان‌گذار Light Ark Technologies، با معرفی ArcOS راهکاری برای توقف «رانش شخصیت» (Persona Drift) ارائه داد. این سیستم پرامپت‌های شکننده را با ۷۵ بلوک تصمیم‌گیرندهٔ قطعی…

۲ دقیقه خواندن