
جادوی ۴۴۰ مگابایتی تنسنت برای شکست دادن گوگل ترنسلیت
تنسنت یک مدل ترجمه فوقفشرده و آفلاین را معرفی کرد که با حجم تنها ۴۴۰ مگابایت، کیفیتی در سطح سیستمهای تجاری بزرگ دارد. این مدل ۳۳ زبان را پشتیبانی میکند و نیاز به اتصال ابری را…
دستهبندی
راهنماهای گامبهگام، دورهها و آموزشهای کاربردی استفاده از هوش مصنوعی — از مهندسی پرامپت تا فاینتیون و RAG.
۱٬۸۲۸ مقاله منتشر شده

تنسنت یک مدل ترجمه فوقفشرده و آفلاین را معرفی کرد که با حجم تنها ۴۴۰ مگابایت، کیفیتی در سطح سیستمهای تجاری بزرگ دارد. این مدل ۳۳ زبان را پشتیبانی میکند و نیاز به اتصال ابری را…

ابزارهای تجاری Meta شاهد جهشی ۱۰ برابری در میزان استفاده بودهاند و تعداد گفتگوهای هفتگی را به ۱۰ میلیون مورد رساندند. این شرکت اکنون با مدل Muse Spark در حال گسترش ابزارهای…

IBM با معرفی خانوادهی Granite 4.1 ثابت کرد که مدلهای کوچکتر با دادههای باکیفیت میتوانند مدلهای غولپیکر را شکست دهند. نسخهی ۸ میلیاردی این مدل در بنچمارکهای کلیدی، عملکرد…

معرفی چارچوب EnterpriseDocBench نشان میدهد سیستمهای تحلیل اسناد علیرغم دقت بالا، در ارائه پاسخهای جامع شکست میخورند. این مطالعه همچنین برتری بازیابی ترکیبی بر بردارهای معنایی…

عصر چتباکسهای متنی به پایان میرسد و جای خود را به رابط کاربری زاینده میدهد. در این مدل، عاملها به جای تولید متن، مؤلفههای بصری طراحیشده را فراخوانی میکنند تا اصطکاک کاربر…

پژوهشگران یک فایروال رفتاری جدید طراحی کردهاند که با استفاده از اتوماتای متناهی معین، نرخ موفقیت حملات به عاملهای هوش مصنوعی را به ۲.۲٪ کاهش میدهد. این سیستم با جایگزینی…

ابزار جدیدی به نام CliGate دسترسی به مدلهای Claude را از طریق زیرساخت گوگل ممکن کرده است. این پروکسی محلی با حذف نیاز به کلیدهای API جداگانه، هزینهها و پیچیدگیهای مدیریتی…

مدل جدید **Claude Mythos Preview** میتواند بهطور خودکار نقاط ضعف زیرساختهای حیاتی را شناسایی و فعال کند. این تحول در حالی که ریسک سیستمهای قدیمی را افزایش میدهد، مفهوم…

روشی جدید به نام Random Cloud اجازه میدهد بدون نیاز به آموزش اولیه، کوچکترین و بهینترین ساختار شبکههای عصبی شناسایی شوند. این متد با جایگزینی چرخه پرهزینه…

پژوهشگران ابزار متنباز HalluCiteChecker را برای شناسایی ارجاعات جعلی در مقالات علمی معرفی کردند. این ابزار سبک، بدون نیاز به GPU و بهصورت آفلاین روی CPUهای معمولی اجرا میشود تا…

یک مدل تخصصی Qwen2.5-7B در تریاژ پزشکی از GPT-4o پیشی گرفت. این نتیجه ثابت میکند تنظیم دقیق روی دادههای بالینی بسیار موثرتر از تکیه بر مدلهای عمومی عظیم است.

پژوهشگران یک عامل خودکار به نام XDFT طراحی کردهاند که دلیل شکست محاسبات نظریه تابعی چگالی در تطبیق با دادههای تجربی را تشخیص میدهد. این سیستم با نرخ موفقیت ۷۸ درصد، بهطور…