پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

مقایسه انواع هوش مصنوعی و روش‌های مورد استفاده در امنیت سایبری
آموزش کاربردی

«برتری مدل‌های کوچک»، رویکرد جدید در مقابله با حملات سایبری

صنعت امنیت سایبری از مدل‌های عمومی به سمت مدل‌های زبانی کوچک (SLM) و تخصصی حرکت می‌کند. این تغییر رویکرد، شناسایی تهدیدات در لحظه را ممکن کرده و همزمان حریم خصوصی داده‌های حساس را…

۲۰ دقیقه خواندن
مدل استنتاجی متراکم ۳ میلیارد پارامتری VibeThinker-3B بر پایه Qwen2.5-Coder-3B با خط لوله پس‌آموزش طیف به سیگنال

VibeThinker-3B: مدل ۳ میلیارد پارامتری در بنچمارک‌های ریاضی با غول‌های ۶۷۱

پژوهشگران Sina Weibo مدل VibeThinker-3B را معرفی کردند؛ یک مدل استدلالی کوچک که در وظایف ریاضی و کدنویسی با مدل‌های عظیمی چون DeepSeek V3.2 رقابت می‌کند. این مدل با استفاده از خط…

۵ دقیقه خواندن
عامل بدون آموزش انویدیا که کد را به‌عنوان رابط عملیاتی برای استدلال مکانی به کار می‌برد

رابط کد-محور در برابر فراخوانی صلب ابزار در مدل‌های بینایی-زبانی

انویدیا چارچوب SpatialClaw را معرفی کرد که به‌جای فراخوانی‌های صلب ابزار، از کد پایتون به‌عنوان رابط اقدام استفاده می‌کند. این رویکرد باعث شد مدل‌های بینایی-زبانی بدون نیاز به…

۵ دقیقه خواندن
رفتار خطای بازگشتی LangGraph بدون از دست دادن وضعیت ذخیره‌شده
آموزش کاربردی

«پایان حلقه‌های بی‌نهایت»؛ راهکار TokenCircuit برای مدیریت هزینه‌های API

موتور متن‌باز TokenCircuit با شناسایی خطاهای منطقی و متوقف کردن حلقه‌های تکراری در عامل‌های هوش مصنوعی، از اتلاف هزینه‌های API و از دست رفتن داده‌ها جلوگیری می‌کند. این ابزار با…

۳ دقیقه خواندن
خدمات توسعه هوش مصنوعی ۲۰۲۶: پرامپت‌نویسی، RAG یا تنظیم دقیق؟
آموزش کاربردی

راهنمای انتخاب میان پرامپت، RAG و تنظیم دقیق برای استقرار AI در سال ۲۰۲۶

بسیاری از پروژه‌های هوش مصنوعی به‌دلیل انتخاب نادرست روش انتقال دانش شکست می‌خورند. این راهنما معیار‌های تصمیم‌گیری میان سه استراتژی اصلی برای بهینه‌سازی هزینه، دقت و مقیاس‌پذیری…

۵ دقیقه خواندن
راهنمای گام‌به‌گام استقرار مدل‌های زبانی بزرگ
آموزش کاربردی

Oxlo.ai با مدل قیمت‌گذاری درخواستی هزینه استنتاج LLM را تثبیت کرد

پلتفرم Oxlo.ai مدل قیمت‌گذاری مبتنی بر توکن را با مدل «درخواست‌محور» جایگزین کرد تا هزینه‌های عملیاتی در گردش‌های کاری پیچیده پیش‌بینی‌پذیر شود. این رویکرد تفاوت میان هزینه پردازش…

۵ دقیقه خواندن
فراخوانی ابزار مبتنی بر پرامپت برای مدل‌های زبانی سبک متن‌باز
آموزش کاربردی

«از مخزن دانش به کنترل‌کننده»؛ رویکرد جدید در مدیریت ابزارهای خارجی AI

پژوهشی جدید در AIS2C2 ۲۰۲۵ چارچوبی را معرفی می‌کند که به مدل‌های زبانی کوچک و بازمتن اجازه می‌دهد از طریق پرامپت‌های ساختاریافته از ابزارهای خارجی استفاده کنند. این روش نیاز به…

۲ دقیقه خواندن
مقایسه ابزارهای هوش مصنوعی تبدیل متن به ویدیو — رندرریل استودیو، ژوئن ۲۰۲۶
آموزش کاربردی

مدل‌های لورا مرز میان ویدیوهای آماتور و حرفه‌ای AI را جابه‌جا کردند

استودیوی Rendereel تأکید می‌کند که خروجی‌های باکیفیت در ویدیوهای هوش مصنوعی دیگر با ابزارهای عمومی ممکن نیست. برای عبور از سقف کیفی آماتورها، استفاده از مدل‌های لورا (LoRA) برای…

۲ دقیقه خواندن
تصویری از وب‌سایت «In the Weights» که نشان می‌دهد مدل‌های هوش مصنوعی چه اطلاعاتی از شما دارند.
اخبار کوتاه روزانه

نقشهٔ حافظهٔ مدل‌ها؛ ابزاری برای سنجش میزان حضور انسان‌ها در وزن‌های AI

کارمند سابق OpenAI ابزاری را معرفی کردند که میزان تثبیت نام و هویت افراد در وزن‌های مدل‌های زبانی بزرگ را اندازه‌گیری می‌کند. این سامانه نشان می‌دهد که آیا یک مدل، شما را به…

۱ دقیقه خواندن
مدل استدلالی باز ۵۵۰ میلیارد پارامتری انویدیا که همه چیز را تغییر داد
اخبار کوتاه روزانه

نمودار Nemotron 3 Ultra در برابر مدل‌های بسته؛ برابری در توان استدلالی

انویدیا مدل Nemotron 3 Ultra را معرفی کرد که برخلاف مدل‌های پیشرو، نه تنها وزن‌ها، بلکه داده‌های آموزشی و متدهای ساخت را نیز به‌صورت باز منتشر کرده است. این مدل با معماری ترکیبی،…

۲ دقیقه خواندن