موضوع

مدل‌های بازوزن

Open-source models, open weights, local hosting, licensing

۴۸۸ مقاله منتشر شده

جذب مشتری ۵ دلاری در ماه: ترکیب Llama 3.1 و n8n برای فریلنسرها

یک دانش‌آموز ۱۷ ساله با استفاده از Llama 3.1 و n8n، سیستمی خودکار برای پیدا کردن پروژه‌ها و ارسال پیشنهاد به مشتریان ساخته است. این سامانه که روی یک Raspberry Pi 3 اجرا می‌شود،…

۴ دقیقه خواندن

آموزش کاربردی۲ هفته پیش

چطور با یک استک محلی، مالکیت کامل حافظه هوش مصنوعی خود را پس بگیرید؟

یک توسعه‌دهنده استکی تأییدشده برای ساخت «مغز دوم» هوش مصنوعی به‌صورت کاملاً محلی معرفی کرده است. این سیستم با ترکیب Obsidian و Hermes Agent، ثبت دانش را بدون نیاز به ابر و با…

۲ دقیقه خواندن

ژوئن ۲۰۲۶ شلوغ: Claude Fable 5، MiniMax M3، OpenAI Spud و ۲۵ مدل جدید

اخبار کوتاه روزانه۲ هفته پیش

۲۵ مدل هوش مصنوعی در یک هفته: عصر تخصص و وزن‌های باز

موج گسترده انتشار مدل‌ها در ژوئن ۲۰۲۶، از Claude Fable 5 تا MiniMax M3، نشان‌دهنده چرخش صنعت به سمت تخصص و تسلط مدل‌های وزن‌باز است. این روند با افشای جزئیات مدل عامل‌محور Spud از…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چگونه FADA تحلیل تخصصی سونوگرافی جنین را به سخت‌افزار موبایل منتقل کرد؟

مدل FADA با یکپارچه‌سازی تشخیص و تحلیل سونوگرافی جنین در یک خط لوله واحد، امکان تشخیص بالینی آفلاین را روی گوشی‌های هوشمند فراهم کرده است. این سیستم با هدف کاهش شکاف تشخیصی در…

۲ دقیقه خواندن

آموزش کاربردی۳ هفته پیش

دقت ۹۸.۴ درصدی YOLO26x؛ پایان پرداخت‌های ماهانه برای پایش حیات وحش

پژوهشگران یک مدل متن‌باز با دقت بسیار بالا برای شناسایی ۳۱ گونه از پستانداران و پرندگان بریتانیا عرضه کردند. این ابزار قصد دارد جایگزین پلتفرم‌های تجاری گران‌قیمت شود تا…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

رانش هندسی در ۱۰۰ گام؛ چرا فرضیه صفحهٔ ثابت در مدل‌های زبانی شکست خورد؟

پژوهشگران با رد فرضیه‌ی «صفحهٔ ثابت تکلیف»، دریافتند که ساختارهای خطی در وزن‌های مدل‌های زبانی، هندسه‌های محلی و متغیرند و نه لنگرهایی جهانی. این یافته نشان می‌دهد که مسیرهای…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

Dep-LLM و چالش مدل‌های نظارت‌شده: تشخیص افسردگی بدون آموزش مجدد

چارچوب Dep-LLM با تقلید از استدلال‌های روان‌پزشکی، تشخیص افسردگی را بدون نیاز به آموزش یا تنظیم دقیق مدل انجام می‌دهد. این سیستم با تحلیل چندعاملی و وزن‌دهی بر اساس سطح اطمینان،…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

رمزگشایی از Spatial-Omni: تزریق درک سه‌بعدی صدا به مدل‌های زبانی

معرفی روش Spatial-Omni برای ادغام صدای فضایی در مدل‌های زبانی چندوجهی. این سیستم با استفاده از کدگذاری FOA، بدون نیاز به تغییر در رمزگذارهای صوتی اولیه، دقت مکان‌یابی صدا و…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا معماری ترکیبی CPU-GPU نیاز به کوانتیزه کردن مدل‌های MoE را از بین می‌برد؟

پژوهشگران با طراحی یک معماری ترکیبی، اجرای مدل‌های Mixture-of-Experts (MoE) با دقت اصلی را روی سخت‌افزارهای مصرف‌کننده و با عملکردی در سطح مراکز داده ممکن کرده‌اند. این سیستم با…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

پروتکل Alert-Confirm و افشای نقاط کور هوش مصنوعی در تشخیص بحران‌های روانی

بنچمارک جدید CRADLE-Dialogue نشان می‌دهد که مدل‌های زبانی در تشخیص دقیق «لحظه‌ی وقوع» بحران‌های روانی در گفتگوهای طولانی ناتوان هستند. این شکاف فنی، استفاده از AI به عنوان سیستم…

۱ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا Visual-SDPO در اصلاح خطاهای بصری کدنویسی، GRPO را شکست می‌دهد؟

چارچوب جدید Visual-SDPO با استفاده از بازخوردهای بصری رندر شده، مدل‌های زبانی را برای تولید کدهای دقیق‌تر در نمودارها و رابط‌های کاربری آموزش می‌دهد. این روش با هدف قرار دادن…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۳ هفته پیش

چرا مدل‌های زبانی باز ارزیابی‌های تنظیم MIMO را ۶ برابر کاهش می‌دهند؟

مدل‌های زبانی باز (Open LLMs) می‌توانند با پیشنهاد پیش‌فرض‌های ساختاری غیرمنتظره، تعداد تکرارهای مورد نیاز برای تنظیم کنترل‌کننده‌های صنعتی پیچیده را تا ۶ برابر کاهش دهند. این…

۲ دقیقه خواندن