موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

امنیت سایبری در جیب شما؛ وقتی مدل کوچک بر غول‌ها پیروز می‌شود

مدل CyberSecQwen-4B با وجود اندازه کوچک‌تر، در تحلیل تهدیدات سایبری مدل‌های ۸ میلیاردی را شکست داد. این دستاورد به تحلیل‌گران اجازه می‌دهد داده‌های حساس را بدون ریسک نشت اطلاعات،…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

ترفند جدید انویدیا برای تبدیل مدل‌های کوچک به برنامه‌نویسان حرفه‌ای Bash

پژوهشگران انویدیا با استفاده از رمزگشایی محدود به گرامر، دقت مدل‌های زبانی کوچک را در تولید دستورات Bash به ۷۵ درصد رساندند. این دستاورد یعنی مدل‌های بسیار کوچک حالا می‌توانند…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

چگونه OpenOSINT تحقیقات جاسوسی دیجیتال را به یک دستور ساده تبدیل کرد؟

OpenOSINT یک عامل هوشمند است که فرآیند خسته‌کننده‌ی جابه‌جایی بین ابزارهای جاسوسی منابع باز را حذف می‌کند. این ابزار با استفاده از یک حلقه‌ی استدلالی پویا، اجازه می‌دهد تحقیقات…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

رمزگشایی از ion7-core؛ وقتی اجرای AI دیگر نیازی به رم‌های حجیم ندارد

یک رابط جدید به نام ion7-core با استفاده از LuaJIT، مصرف حافظه مدل‌های زبانی را به شدت کاهش داده است. این ابزار با حذف لایه‌ی سنگین پایتون، امکان اجرای هوش مصنوعی را روی…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

تبدیل GPUهای خانگی به موتورهای استقامتی؛ جادوی MTP در Gemma 4

ترکیب مدل Gemma 4 31B با تکنولوژی پیش‌بینی چند-توکنی (MTP)، اجرای عامل‌های هوشمند و پیچیده را روی سخت‌افزارهای خانگی ممکن کرده است. این تحول به توسعه‌دهندگان اجازه می‌دهد بدون…

۳ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

خداحافظی با CUDA؛ مسیر جدید و ارزان‌تر برای آموزش مدل‌های پزشکی

پروژه MedQA ثابت کرد که برای تنظیم دقیق مدل‌های پزشکی، دیگر نیازی به سخت‌افزارهای انویدیا نیست. این تیم با استفاده از تراشه‌های AMD و اکوسیستم ROCm، مدل Qwen3-1.7B را در تنها ۵…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا برای ساخت مدل‌های دقیق‌تر، باید کمتر کد بنویسیم؟

پژوهشگران روشی را ابداع کرده‌اند که در آن مدل‌های زبانی به‌جای بازنویسی کامل معماری‌های عصبی، تنها تغییرات ضروری (Diffs) را اعمال می‌کنند. این رویکرد طول خروجی را تا ۸۵٪ کاهش داده…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

رمزگشایی از Hybrid-DPO: ضربه‌ای مهلک به توهمات منطقی مدل‌های زبانی

چارچوب RLearner-LLM با معرفی Hybrid-DPO، «سوگیری پرحرفی» را هدف قرار داده تا مدل‌ها به جای فصاحت، بر درستی منطقی تمرکز کنند. این روش باعث بهبود ۶ برابری در مبنی‌سازی منطقی مدل‌ها…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

پیروزی خیره‌کننده RaguTeam: غلبه بر gpt-oss-120b با یک ارکستراسیون هوشمند

تیم RaguTeam با به‌کارگیری یک مجموعه مدل‌های متنوع، مقام اول مسابقات SemEval-2026 را به دست آورد. این سیستم با استفاده از GPT-4o-mini به عنوان داور، توانست در تولید پاسخ‌های…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

افشای شکاف استدلالی؛ مدل‌های متن‌باز در برابر آزمون DiffCap-Bench شکست خوردند

معرفی بنچ‌مارک DiffCap-Bench نشان داد که مدل‌های تجاری در درک تفاوت‌های بصری، فرسنگ‌ها از مدل‌های متن‌باز جلوترند. این یافته ثابت می‌کند که صرفاً بزرگ‌تر کردن مدل‌ها، مشکل استدلال…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ ماه پیش

چرا پنجره‌های بافت بزرگ‌تر راه نجات عامل‌های هوش مصنوعی نیستند؟

پژوهشگران با معرفی LongSeeker، پارادایم جدیدی برای مدیریت حافظه در عامل‌های جستجو ایجاد کرده‌اند. این مدل با حذف داده‌های زائد، دقت جستجوهای پیچیده را به ۶۲.۵٪ رسانده و رقبای…

۲ دقیقه خواندن

آموزش کاربردی۲ ماه پیش

پایان عصر عامل‌های یکپارچه؛ قدرت پنهان در «هارنس‌های نازک»

پروژه‌ی open-claude-design ثابت کرد که استفاده از «هارنس‌های نازک» برای مدیریت ابزارهای موجود، بسیار کارآمدتر از ساخت عامل‌های حجیم است. این سیستم با بازسازی خط لوله‌ی ابزار طراحی…

۲ دقیقه خواندن