
مدل انتشار iLLaDA در استدلال پایه با Qwen2.5 برابری کرد
پژوهشگران بایتدنس مدل iLLaDA را معرفی کردند که با معماری انتشار (Diffusion) بهجای پیشبینی ترتیبی توکنها، متن را بهصورت موازی پالایش میکند. این مدل ۸ میلیارد پارامتری در…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۳ مقاله منتشر شده

پژوهشگران بایتدنس مدل iLLaDA را معرفی کردند که با معماری انتشار (Diffusion) بهجای پیشبینی ترتیبی توکنها، متن را بهصورت موازی پالایش میکند. این مدل ۸ میلیارد پارامتری در…

یک استاد دانشگاه در itelnet Consulting روشی تکرارپذیر برای تبدیل مفاهیم فنی به استراتژیهای اجرایی سریع ابداع کرده است. این متد با جایگزینی گفتگوهای پراکنده با یک چارچوب…

سنتز گفتار از پردازش سیگنال به سمت مدلسازی خودبازگشتی زبانی حرکت کرده و با صوت به عنوان توکنهای گسسته برخورد میکند. این تغییر، شبیهسازی صفر-نمونه و لحن پویا را ممکن کرده، اما…

پلتفرم Oxlo.ai با جایگزینی مدل قیمتگذاری توکنی با مدل «درخواستمحور»، هزینهی ترجمه اسناد حجیم را ۱۰ تا ۱۰۰ برابر ارزان کرد. این تغییر، موانع مالی برای استقرار گردشهای کاری…

تحلیلی از تضاد میان استقرار محلی مدلهای زبانی در برابر خدمات ابری مانند ChatGPT. انتخاب نهایی شرکتها بر اساس تعادل میان سرعت پیادهسازی و کنترل کامل بر دادهها شکل میگیرد.

ابزار AutoFit2 با ترکیب SBERT و SetFit، امکان طبقهبندی متون با دقت ۹۵ تا ۹۹ درصد را تنها با چند ده نمونه داده فراهم میکند. این خط لوله (Pipeline) خودکار، فرآیند آموزش مدلهای…

ردیت به دلیل داشتن مجموعهدادههای عظیم از قصد انسانها و بازخوردهای فنی، محیطی ایدهآل برای تنظیم دقیق مدلهای زبانی است. توسعهدهندگان میتوانند با استفاده از API این پلتفرم،…

مجموعهای از ابزارهای متنباز، مسیر تبدیل GPUهای مصرفی به موتورهای استنتاج سریع را هموار کردهاند. این ابزارها بر بهینهسازی حافظه، تبدیل اسناد غیرساختاریافته و مدیریت عاملهای…

ورسل با معرفی چارچوب متنباز Eve و شرکت دیاgrid با بهروزرسانی Dapr 1.18، ابزارهایی برای مدیریت حافظه و تأیید امنیتی عاملها ارائه دادند. همزمان، الگوهای جدیدی برای ادغام این…

تستهای عملی روی ۱۰ مدل کدنویسی نشان میدهد که Qwen3-Coder-30B بهترین کیفیت را در برابر قیمت ارائه میدهد، در حالی که DeepSeek V4 Flash اقتصادیترین گزینه است. این یافتهها نیاز…

ابزار متنباز SuperCompress با فیلتر کردن توکنهای غیرضروری در سطح CPU، هزینههای محاسباتی و انتشار کربن را ۶۵٪ کاهش میدهد. این سازوکار بدون کاهش دقت پاسخها، فشار روی GPU را…

اتحادیه اروپا در واکنش به کنترلهای صادراتی سختگیرانه آمریکا بر مدل Claude Fable، تلاش برای دستیابی به «حاکمیت هوش مصنوعی» را تسریع کرد. هدف این جنبش، کاهش وابستگی استراتژیک به…