پرش به محتوای اصلی

موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

چگونه FADA تحلیل تخصصی سونوگرافی جنین را به سخت‌افزار موبایل منتقل کرد؟

چگونه FADA تحلیل تخصصی سونوگرافی جنین را به سخت‌افزار موبایل منتقل کرد؟

مدل FADA با یکپارچه‌سازی تشخیص و تحلیل سونوگرافی جنین در یک خط لوله واحد، امکان تشخیص بالینی آفلاین را روی گوشی‌های هوشمند فراهم کرده است. این سیستم با هدف کاهش شکاف تشخیصی در…

۲ دقیقه خواندن
دقت ۹۸.۴ درصدی YOLO26x؛ پایان پرداخت‌های ماهانه برای پایش حیات وحش
آموزش کاربردی

دقت ۹۸.۴ درصدی YOLO26x؛ پایان پرداخت‌های ماهانه برای پایش حیات وحش

پژوهشگران یک مدل متن‌باز با دقت بسیار بالا برای شناسایی ۳۱ گونه از پستانداران و پرندگان بریتانیا عرضه کردند. این ابزار قصد دارد جایگزین پلتفرم‌های تجاری گران‌قیمت شود تا…

۲ دقیقه خواندن
رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

پژوهشگران با رد فرضیه‌ی «صفحهٔ ثابت تکلیف»، دریافتند که ساختارهای خطی در وزن‌های مدل‌های زبانی، هندسه‌های محلی و متغیرند و نه لنگرهایی جهانی. این یافته نشان می‌دهد که مسیرهای…

۱ دقیقه خواندن
Dep-LLM و چالش مدل‌های نظارت‌شده: تشخیص افسردگی بدون آموزش مجدد

Dep-LLM و چالش مدل‌های نظارت‌شده: تشخیص افسردگی بدون آموزش مجدد

چارچوب Dep-LLM با تقلید از استدلال‌های روان‌پزشکی، تشخیص افسردگی را بدون نیاز به آموزش یا تنظیم دقیق مدل انجام می‌دهد. این سیستم با تحلیل چندعاملی و وزن‌دهی بر اساس سطح اطمینان،…

۲ دقیقه خواندن
چرا معماری ترکیبی CPU-GPU نیاز به کوانتیزه کردن مدل‌های MoE را از بین می‌برد؟

چرا معماری ترکیبی CPU-GPU نیاز به کوانتیزه کردن مدل‌های MoE را از بین می‌برد؟

پژوهشگران با طراحی یک معماری ترکیبی، اجرای مدل‌های Mixture-of-Experts (MoE) با دقت اصلی را روی سخت‌افزارهای مصرف‌کننده و با عملکردی در سطح مراکز داده ممکن کرده‌اند. این سیستم با…

۲ دقیقه خواندن
پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

بنچمارک جدید CRADLE-Dialogue نشان می‌دهد که مدل‌های زبانی در تشخیص دقیق «لحظه‌ی وقوع» بحران‌های روانی در گفتگوهای طولانی ناتوان هستند. این شکاف فنی، استفاده از AI به عنوان سیستم…

۱ دقیقه خواندن
چرا Visual-SDPO در اصلاح خطاهای بصری کدنویسی، GRPO را شکست می‌دهد؟

چرا Visual-SDPO در اصلاح خطاهای بصری کدنویسی، GRPO را شکست می‌دهد؟

چارچوب جدید Visual-SDPO با استفاده از بازخوردهای بصری رندر شده، مدل‌های زبانی را برای تولید کدهای دقیق‌تر در نمودارها و رابط‌های کاربری آموزش می‌دهد. این روش با هدف قرار دادن…

۲ دقیقه خواندن
چرا مدل‌های زبانی باز ارزیابی‌های تنظیم MIMO را ۶ برابر کاهش می‌دهند؟

چرا مدل‌های زبانی باز ارزیابی‌های تنظیم MIMO را ۶ برابر کاهش می‌دهند؟

مدل‌های زبانی باز (Open LLMs) می‌توانند با پیشنهاد پیش‌فرض‌های ساختاری غیرمنتظره، تعداد تکرارهای مورد نیاز برای تنظیم کنترل‌کننده‌های صنعتی پیچیده را تا ۶ برابر کاهش دهند. این…

۲ دقیقه خواندن