موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۶ مقاله منتشر شده

مقایسه انواع هوش مصنوعی و روش‌های مورد استفاده در امنیت سایبری

«برتری مدل‌های کوچک»، رویکرد جدید در مقابله با حملات سایبری

صنعت امنیت سایبری از مدل‌های عمومی به سمت مدل‌های زبانی کوچک (SLM) و تخصصی حرکت می‌کند. این تغییر رویکرد، شناسایی تهدیدات در لحظه را ممکن کرده و همزمان حریم خصوصی داده‌های حساس را…

۲۰ دقیقه خواندن

مدل استنتاجی متراکم ۳ میلیارد پارامتری VibeThinker-3B بر پایه Qwen2.5-Coder-3B با خط لوله پس‌آموزش طیف به سیگنال

تحلیل و بررسی تخصصیهفتهٔ گذشته

VibeThinker-3B: مدل ۳ میلیارد پارامتری در بنچمارک‌های ریاضی با غول‌های ۶۷۱

پژوهشگران Sina Weibo مدل VibeThinker-3B را معرفی کردند؛ یک مدل استدلالی کوچک که در وظایف ریاضی و کدنویسی با مدل‌های عظیمی چون DeepSeek V3.2 رقابت می‌کند. این مدل با استفاده از خط…

۵ دقیقه خواندن

عامل بدون آموزش انویدیا که کد را به‌عنوان رابط عملیاتی برای استدلال مکانی به کار می‌برد

تحلیل و بررسی تخصصیهفتهٔ گذشته

رابط کد-محور در برابر فراخوانی صلب ابزار در مدل‌های بینایی-زبانی

انویدیا چارچوب SpatialClaw را معرفی کرد که به‌جای فراخوانی‌های صلب ابزار، از کد پایتون به‌عنوان رابط اقدام استفاده می‌کند. این رویکرد باعث شد مدل‌های بینایی-زبانی بدون نیاز به…

۵ دقیقه خواندن

رفتار خطای بازگشتی LangGraph بدون از دست دادن وضعیت ذخیره‌شده

آموزش کاربردیهفتهٔ گذشته

«پایان حلقه‌های بی‌نهایت»؛ راهکار TokenCircuit برای مدیریت هزینه‌های API

موتور متن‌باز TokenCircuit با شناسایی خطاهای منطقی و متوقف کردن حلقه‌های تکراری در عامل‌های هوش مصنوعی، از اتلاف هزینه‌های API و از دست رفتن داده‌ها جلوگیری می‌کند. این ابزار با…

۳ دقیقه خواندن

اکوسیستم معاملات الگوریتمی خودمیزبان من: چرا متن‌باز است

آموزش کاربردیهفتهٔ گذشته

ابزارهای ساده در برابر فریم‌ورک‌های پیچیده در معماری DepthSight

پلتفرم متن‌باز DepthSight با ارائه ابزاری برای میزبانی شخصی (Self-hosting)، کنترل کامل داده‌های حساس را به معامله‌گران بازمی‌گرداند. این سیستم با جایگزینی بات‌های متمرکز با یک…

۸ دقیقه خواندن

خدمات توسعه هوش مصنوعی ۲۰۲۶: پرامپت‌نویسی، RAG یا تنظیم دقیق؟

آموزش کاربردیهفتهٔ گذشته

راهنمای انتخاب میان پرامپت، RAG و تنظیم دقیق برای استقرار AI در سال ۲۰۲۶

بسیاری از پروژه‌های هوش مصنوعی به‌دلیل انتخاب نادرست روش انتقال دانش شکست می‌خورند. این راهنما معیار‌های تصمیم‌گیری میان سه استراتژی اصلی برای بهینه‌سازی هزینه، دقت و مقیاس‌پذیری…

۵ دقیقه خواندن

راهنمای گام‌به‌گام استقرار مدل‌های زبانی بزرگ

آموزش کاربردیهفتهٔ گذشته

Oxlo.ai با مدل قیمت‌گذاری درخواستی هزینه استنتاج LLM را تثبیت کرد

پلتفرم Oxlo.ai مدل قیمت‌گذاری مبتنی بر توکن را با مدل «درخواست‌محور» جایگزین کرد تا هزینه‌های عملیاتی در گردش‌های کاری پیچیده پیش‌بینی‌پذیر شود. این رویکرد تفاوت میان هزینه پردازش…

۵ دقیقه خواندن

فراخوانی ابزار مبتنی بر پرامپت برای مدل‌های زبانی سبک متن‌باز

آموزش کاربردیهفتهٔ گذشته

«از مخزن دانش به کنترل‌کننده»؛ رویکرد جدید در مدیریت ابزارهای خارجی AI

پژوهشی جدید در AIS2C2 ۲۰۲۵ چارچوبی را معرفی می‌کند که به مدل‌های زبانی کوچک و بازمتن اجازه می‌دهد از طریق پرامپت‌های ساختاریافته از ابزارهای خارجی استفاده کنند. این روش نیاز به…

۲ دقیقه خواندن

مقایسه ابزارهای هوش مصنوعی تبدیل متن به ویدیو — رندرریل استودیو، ژوئن ۲۰۲۶

آموزش کاربردیهفتهٔ گذشته

مدل‌های لورا مرز میان ویدیوهای آماتور و حرفه‌ای AI را جابه‌جا کردند

استودیوی Rendereel تأکید می‌کند که خروجی‌های باکیفیت در ویدیوهای هوش مصنوعی دیگر با ابزارهای عمومی ممکن نیست. برای عبور از سقف کیفی آماتورها، استفاده از مدل‌های لورا (LoRA) برای…

۲ دقیقه خواندن

تصویری از وب‌سایت «In the Weights» که نشان می‌دهد مدل‌های هوش مصنوعی چه اطلاعاتی از شما دارند.

اخبار کوتاه روزانههفتهٔ گذشته

نقشهٔ حافظهٔ مدل‌ها؛ ابزاری برای سنجش میزان حضور انسان‌ها در وزن‌های AI

کارمند سابق OpenAI ابزاری را معرفی کردند که میزان تثبیت نام و هویت افراد در وزن‌های مدل‌های زبانی بزرگ را اندازه‌گیری می‌کند. این سامانه نشان می‌دهد که آیا یک مدل، شما را به…

۱ دقیقه خواندن

رابط توسعه ابری با قابلیت هوش مصنوعی رایگان نامحدود در حال کار

آموزش کاربردیهفتهٔ گذشته

درون IDE ابری Neural Inverse Cloud؛ مدیریت ترافیک برای پایداری هزینه‌ها

پلتفرم Neural Inverse Cloud با معرفی یک IDE ابری، محدودیت‌های دسترسی به مدل‌های هوش مصنوعی را از طریق مسیریابی درخواست‌ها بر اساس پیچیدگی وظایف برطرف کرده است. این سیستم به‌جای…

۵ دقیقه خواندن

مدل استدلالی باز ۵۵۰ میلیارد پارامتری انویدیا که همه چیز را تغییر داد

اخبار کوتاه روزانههفتهٔ گذشته

نمودار Nemotron 3 Ultra در برابر مدل‌های بسته؛ برابری در توان استدلالی

انویدیا مدل Nemotron 3 Ultra را معرفی کرد که برخلاف مدل‌های پیشرو، نه تنها وزن‌ها، بلکه داده‌های آموزشی و متدهای ساخت را نیز به‌صورت باز منتشر کرده است. این مدل با معماری ترکیبی،…

۲ دقیقه خواندن