موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

چگونه «بومی‌سازی فرهنگی» نرخ موفقیت حملات به مدل‌های زبانی را ۹.۳٪ افزایش داد؟

ترجمهٔ مستقیم بنچمارک‌های ایمنی انگلیسی برای شناسایی آسیب‌پذیری‌های مدل‌های زبانی در محیط‌های آسیایی ناکارآمد است. مطالعه‌ای جدید ثابت می‌کند که رِد-تیمینگ متناسب با فرهنگ‌های…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

INFUSER: جایگزینی «سختی مسئله» با «امتیاز تأثیر» در آموزش مدل‌ها

چارچوب جدیدی به نام INFUSER با تغییر رویکرد از داده‌های «سخت» به داده‌های «مؤثر»، مدل‌های هوش مصنوعی را قادر می‌سازد تا برنامه آموزشی خود را به‌طور پویا تکامل دهند. این متد باعث…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا متد گرم‌بندی در مدل‌های بینایی-زبانی اثر نهایی RL را تغییر نمی‌دهد؟

یک مطالعه فنی روی مدل‌های بینایی-زبانی نشان می‌دهد که انتخاب بین SFT و OPD در مرحله گرم‌بندی، تنها بر رژیم آنتروپی اولیه اثر می‌گذارد و تأثیری بر عملکرد نهایی یادگیری تقویت‌شده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

سازوکار NutriMLLM: عبور از بن‌بست داده با ۱.۱ میلیون تصویر مصنوعی

پژوهشگران با توسعه‌ی خانواده‌ی مدل‌های NutriMLLM، توانسته‌اند ۶۵ ریزمغذی مختلف را از روی تصاویر غذا تخمین بزنند. این دستاورد از طریق تولید ۱.۱ میلیون تصویر مصنوعی بر اساس داده‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

SearchSwarm-30B: دستیابی به امتیاز ۷۳.۳ در BrowseComp-ZH با هوش تفویض‌محور

مدل با وزن‌های باز SearchSwarm-30B با درونی‌سازی «هوش تفویض» در وزن‌های خود، محدودیت پنجره متنی را در وظایف پژوهشی پیچیده برطرف کرده است. این مدل قادر است اهداف کلان را به…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

AliyunConsoleAgent: دستیابی به عملکرد مدل‌های پیشرو با ۹۲٪ هزینه کمتر

یک چارچوب آموزشی جدید با بهره‌گیری از تقطیر دانش و بهینه‌سازی GRPO، مدلی با ۳۲ میلیارد پارامتر را به سطح مدل‌های تجاری پیشرو در اتوماسیون کنسول‌های ابری رسانده است. این سیستم ضمن…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

توقف ویرایش‌های تصادفی AI در پروژه‌های بزرگ با معماری Sandbox در Plandex

Plandex یک عامل هوشمند متن‌باز و مبتنی بر ترمینال است که برای مدیریت تسک‌های پیچیده کدنویسی در چندین فایل طراحی شده است. این ابزار با ذخیره تغییرات در یک محیط ایزوله پیش از اعمال…

۶ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چرا Qodo برای حل بحران تست‌ها، نقش AI را به «حسابرس» تغییر داد؟

شرکت Qodo (CodiumAI سابق) استراتژی خود را از تولید ویژگی‌های جدید به سمت اتوماسیون تست‌ها و بررسی PRها تغییر داد. این پلتفرم اکنون در سه سطح، از افزونه‌های رایگان تا هسته‌ی…

۶ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه SoloEngine خلأ بین کدنویسی پیچیده و ابزارهای ساده‌ی AI را پر می‌کند؟

شیائومی پلتفرم SoloEngine را معرفی کرد تا ساخت عامل‌های هوشمند بدون کدنویسی ممکن شود. این ابزار با استفاده از حلقه‌های ReAct، فاصله میان جریان‌های کاری صلب و چارچوب‌های پیچیده…

۵ دقیقه خواندن۲

آموزش کاربردی۳ هفته پیش

Mach: وقتی صراحت در کدنویسی بر ایمنی خودکار پیروز می‌شود

زبان برنامه‌نویسی Mach با رد کردن شبکه‌های ایمنی خودکار، کنترل کامل را به برنامه‌نویس بازمی‌گرداند. این زبان با اولویت دادن به صراحت (Explicitness)، قصد دارد هرگونه رفتار پنهان در…

۳ دقیقه خواندن

اخبار کوتاه روزانه۳ هفته پیش

شیائومی: دستیابی به سرعت ۱۰۰۰ توکن در ثانیه برای مدل ۱ تریلیون پارامتری

شیائومی مدل MiMo-V2.5-Pro-UltraSpeed را معرفی کرد که روی GPUهای معمولی به سرعت ۱۰۰۰ توکن در ثانیه می‌رسد. این پیشرفت با ترکیب کوانتایزاسیون FP4 و رمزگشایی موازی-گمانه، گلوگاه‌های…

۷ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

چگونه ArcOS با کدنویسی قطعی، مانع از محو شدن شخصیت عامل‌های هوش مصنوعی می‌شود؟

هایجون ون، بنیان‌گذار Light Ark Technologies، با معرفی ArcOS راهکاری برای توقف «رانش شخصیت» (Persona Drift) ارائه داد. این سیستم پرامپت‌های شکننده را با ۷۵ بلوک تصمیم‌گیرندهٔ قطعی…

۲ دقیقه خواندن