موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

گزارش arXiv: بازدهی ۵۹.۳ درصدی LiteOdyssey در تشخیص بیماری‌های فوق‌کمیاب

چارچوب استدلالی سبک‌وزن LiteOdyssey با تکیه بر سیاست‌های همکاری انسان-ماشین، در تشخیص بیماری‌های بسیار نادر از GPT-5.4 پیشی گرفت. این دستاورد نشان می‌دهد که ساختار استدلالی دقیق…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

VibeThinker-3B: رقابت با Gemini 3 Pro در استدلال با ۳ میلیارد پارامتر

VibeThinker-3B مدلی با ۳ میلیارد پارامتر است که در تسک‌های استدلالی قابل‌راستی‌آزمایی، عملکردی برابر با مدل‌های بسیار بزرگ‌تر مانند Gemini 3 Pro دارد. این مدل از یک خط لوله…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چگونه تفکر مبنی‌ساز، توانایی استدلالی Gemma3-4B را به سطح مدل ۲۷ میلیارد

محققان با معرفی روش «تفکر مبنی‌ساز»، مدل‌های کوچک را قادر ساختند تا گام‌های استدلالی خود را به نقاط دقیق تصویر متصل کنند. این رویکرد باعث شد مدل Gemma3-4B-IT در استدلال‌های مکانی،…

۲ دقیقه خواندن۱

داستان‌ها و مصاحبه‌ها۲ هفته پیش

چرا ۸۴ درصد از تست‌های پایداری هوش مصنوعی در شناسایی شکست‌ها ناکام می‌مانند؟

پروژه llcore نشان می‌دهد تکیه بر مشاهده رفتار مدل برای تضمین پایداری، یک توهم است و ۸۴ درصد شکست‌های خطرناک را نادیده می‌گیرد. تنها گواهینامه‌های ریاضی می‌توانند پایداری را تضمین…

۴ دقیقه خواندن

آموزش کاربردی۲ هفته پیش

Snaply.ai در برابر Whisperflow؛ کدام ابزار تبدیل صوت به متن برای مک برنده است؟

ابزارهای تبدیل صوت به متن محلی در مک‌های سری M جایگزین سرویس‌های ابری شده‌اند. Snaply.ai به دلیل رایگان بودن، قابلیت آفلاین و تمرکز بر حریم خصوصی، به پیشنهاد اول کاربران تبدیل شده…

۱ دقیقه خواندن

آموزش کاربردی۲ هفته پیش

از ۵۰۰ دلار به ۱۱ دلار؛ سازوکار کاهش ۹۷ درصدی هزینه ترجمه در Global APIs

یک توسعه‌دهنده با استفاده از استراتژی مسیریابی لایه‌ای، هزینه ماهانه ترجمه را از ۵۰۰ دلار به ۱۱.۴۲ دلار کاهش داد. این سیستم مدل‌های گران‌قیمت را برای کارهای ساده حذف و جایگزین…

۹ دقیقه خواندن

Z.ai مدل GLM-5.2 را با کانتکست یک میلیون توکن کاربردی، دو سطح تلاش فکری و بدون بنچمارک عرضه کرد

آموزش کاربردی۲ هفته پیش

از ویرایش تکه‌ای به مدیریت کل پروژه؛ سازوکار یک میلیون توکنی GLM-5.2

شرکت Z.ai مدل GLM-5.2 را با پنجره متنی یک میلیون توکنی معرفی کرد تا امکان بارگذاری کامل مخازن کد در حافظه فعال فراهم شود. این مدل با ابزارهایی مثل Claude Code سازگار است و دایره‌ی…

۴ دقیقه خواندن

سروام با جذب ۲۳۴ میلیون دلار به رهبری اچ‌سی‌ال‌تک، جدیدترین یونیکورن هوش مصنوعی هند شد.

اخبار کوتاه روزانه۲ هفته پیش

چرا هند برای امنیت ملی خود روی Sarvam AI شرط‌بندی کرده است؟

شرکت Sarvam AI با جذب ۲۳۴ میلیون دلار سرمایه، به ارزش ۱.۵ میلیارد دلار رسید. هدف این پروژه ساخت یک زیرساخت هوش مصنوعی حاکمیتی برای کاهش وابستگی هند به شرکت‌های آمریکایی است.

۴ دقیقه خواندن

زندگی با AI۲ هفته پیشتأییدنشده · منبع منفرد

چرا توسعه‌دهندگان مدل‌های ابری Claude را با Qwen 3.6 محلی جایگزین می‌کنند؟

برنامه‌نویسان در حال جایگزینی اشتراک‌های گران‌قیمت ابری با پشته‌های محلی بر پایه Qwen 3.6 و Pi.dev هستند. این روند، اولویت را از «استدلال سطح ارشد» به «حریم خصوصی و هزینه صفر»…

۹ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

چرا برای تفکیک مسیرهای تفسیری LLMها دیگر نیازی به آموزش دیکشنری نیست؟

گردش‌کار جدیدی به نام ICALens با بهره‌گیری از تحلیل مؤلفه‌های مستقل (ICA)، مسیرهای تفسیری در بازنمایی‌های مدل‌های زبانی را بدون نیاز به آموزش متمرکز و هزینه‌بر دیکشنری‌ها بازیابی…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۲ هفته پیش

تضاد حافظه پارامتریک و استردادی: چرا LoRA در تشخیص نبودِ واقعیت‌ها ناتوان است؟

پژوهشی جدید نشان می‌دهد شخصی‌سازی مدل‌های زبانی یک قابلیت واحد نیست، بلکه شکافی میان «سبک رفتاری» و «دقت واقع‌گرایانه» است. در حالی که LoRA در تقلید از لحن کاربر موفق است، RAG در…

۲ دقیقه خواندن

آموزش کاربردی۲ هفته پیش

۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی

مهندسی هوش مصنوعی از رپرهای ساده‌ی API به سمت سیستم‌های عامل‌محور و تخصصی حرکت می‌کند. توسعه‌دهندگان برتر اکنون برای دستیابی به پایداری و کاهش هزینه، بر RAG عامل‌محور و مدل‌های…

۶ دقیقه خواندن