پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

گزارش arXiv: بازدهی ۵۹.۳ درصدی LiteOdyssey در تشخیص بیماری‌های فوق‌کمیاب

گزارش arXiv: بازدهی ۵۹.۳ درصدی LiteOdyssey در تشخیص بیماری‌های فوق‌کمیاب

چارچوب استدلالی سبک‌وزن LiteOdyssey با تکیه بر سیاست‌های همکاری انسان-ماشین، در تشخیص بیماری‌های بسیار نادر از GPT-5.4 پیشی گرفت. این دستاورد نشان می‌دهد که ساختار استدلالی دقیق…

۲ دقیقه خواندن
چگونه تفکر مبنی‌ساز، توانایی استدلالی Gemma3-4B را به سطح مدل ۲۷ میلیارد

چگونه تفکر مبنی‌ساز، توانایی استدلالی Gemma3-4B را به سطح مدل ۲۷ میلیارد

محققان با معرفی روش «تفکر مبنی‌ساز»، مدل‌های کوچک را قادر ساختند تا گام‌های استدلالی خود را به نقاط دقیق تصویر متصل کنند. این رویکرد باعث شد مدل Gemma3-4B-IT در استدلال‌های مکانی،…

۲ دقیقه خواندن۱
چرا ۸۴ درصد از تست‌های پایداری هوش مصنوعی در شناسایی شکست‌ها ناکام می‌مانند؟

چرا ۸۴ درصد از تست‌های پایداری هوش مصنوعی در شناسایی شکست‌ها ناکام می‌مانند؟

پروژه llcore نشان می‌دهد تکیه بر مشاهده رفتار مدل برای تضمین پایداری، یک توهم است و ۸۴ درصد شکست‌های خطرناک را نادیده می‌گیرد. تنها گواهینامه‌های ریاضی می‌توانند پایداری را تضمین…

۴ دقیقه خواندن
Snaply.ai در برابر Whisperflow؛ کدام ابزار تبدیل صوت به متن برای مک برنده است؟
آموزش کاربردی

Snaply.ai در برابر Whisperflow؛ کدام ابزار تبدیل صوت به متن برای مک برنده است؟

ابزارهای تبدیل صوت به متن محلی در مک‌های سری M جایگزین سرویس‌های ابری شده‌اند. Snaply.ai به دلیل رایگان بودن، قابلیت آفلاین و تمرکز بر حریم خصوصی، به پیشنهاد اول کاربران تبدیل شده…

۱ دقیقه خواندن
از ۵۰۰ دلار به ۱۱ دلار؛ سازوکار کاهش ۹۷ درصدی هزینه ترجمه در Global APIs
آموزش کاربردی

از ۵۰۰ دلار به ۱۱ دلار؛ سازوکار کاهش ۹۷ درصدی هزینه ترجمه در Global APIs

یک توسعه‌دهنده با استفاده از استراتژی مسیریابی لایه‌ای، هزینه ماهانه ترجمه را از ۵۰۰ دلار به ۱۱.۴۲ دلار کاهش داد. این سیستم مدل‌های گران‌قیمت را برای کارهای ساده حذف و جایگزین…

۹ دقیقه خواندن
چرا توسعه‌دهندگان مدل‌های ابری Claude را با Qwen 3.6 محلی جایگزین می‌کنند؟
زندگی با AIتأییدنشده · منبع منفرد

چرا توسعه‌دهندگان مدل‌های ابری Claude را با Qwen 3.6 محلی جایگزین می‌کنند؟

برنامه‌نویسان در حال جایگزینی اشتراک‌های گران‌قیمت ابری با پشته‌های محلی بر پایه Qwen 3.6 و Pi.dev هستند. این روند، اولویت را از «استدلال سطح ارشد» به «حریم خصوصی و هزینه صفر»…

۹ دقیقه خواندن
چرا برای تفکیک مسیرهای تفسیری LLMها دیگر نیازی به آموزش دیکشنری نیست؟

چرا برای تفکیک مسیرهای تفسیری LLMها دیگر نیازی به آموزش دیکشنری نیست؟

گردش‌کار جدیدی به نام ICALens با بهره‌گیری از تحلیل مؤلفه‌های مستقل (ICA)، مسیرهای تفسیری در بازنمایی‌های مدل‌های زبانی را بدون نیاز به آموزش متمرکز و هزینه‌بر دیکشنری‌ها بازیابی…

۲ دقیقه خواندن
تضاد حافظه پارامتریک و استردادی: چرا LoRA در تشخیص نبودِ واقعیت‌ها ناتوان است؟

تضاد حافظه پارامتریک و استردادی: چرا LoRA در تشخیص نبودِ واقعیت‌ها ناتوان است؟

پژوهشی جدید نشان می‌دهد شخصی‌سازی مدل‌های زبانی یک قابلیت واحد نیست، بلکه شکافی میان «سبک رفتاری» و «دقت واقع‌گرایانه» است. در حالی که LoRA در تقلید از لحن کاربر موفق است، RAG در…

۲ دقیقه خواندن
۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی
آموزش کاربردی

۵ معماری جایگزین رپرهای ChatGPT برای تبدیل نمونه‌های اولیه به محصول واقعی

مهندسی هوش مصنوعی از رپرهای ساده‌ی API به سمت سیستم‌های عامل‌محور و تخصصی حرکت می‌کند. توسعه‌دهندگان برتر اکنون برای دستیابی به پایداری و کاهش هزینه، بر RAG عامل‌محور و مدل‌های…

۶ دقیقه خواندن