
تحلیل ارکایو: ریاضیاتِ غافلگیری، کلید خروج از بنبست RLHF
یک چارچوب ریاضی جدید به نام «غافلگیری کالیبره شده» معرفی شده است که کیفیت خلاقیت در متون هوش مصنوعی را بهجای حس سلیقهای، با فرمولهای اطلاعاتی میسنجد. این پژوهش ثابت میکند که…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۴۰ مقاله منتشر شده

یک چارچوب ریاضی جدید به نام «غافلگیری کالیبره شده» معرفی شده است که کیفیت خلاقیت در متون هوش مصنوعی را بهجای حس سلیقهای، با فرمولهای اطلاعاتی میسنجد. این پژوهش ثابت میکند که…

ابزار جدیدی به نام CliGate دسترسی به مدلهای Claude را از طریق زیرساخت گوگل ممکن کرده است. این پروکسی محلی با حذف نیاز به کلیدهای API جداگانه، هزینهها و پیچیدگیهای مدیریتی…

مدل جدید **Claude Mythos Preview** میتواند بهطور خودکار نقاط ضعف زیرساختهای حیاتی را شناسایی و فعال کند. این تحول در حالی که ریسک سیستمهای قدیمی را افزایش میدهد، مفهوم…

محققان روشی به نام DIRECT ابداع کردهاند که به مدلهای عصبی اجازه میدهد بدون نیاز به پسانتشار (Backpropagation)، جهت علت و معلول را یاد بگیرند. این دستاورد، مسیر را برای ساخت…

پژوهشگران چارچوب TIDE را معرفی کردند که اجازه میدهد مدلهای کوچک از مدلهای غولپیکر یاد بگیرند. این فناوری شکاف معماری را از بین برده و قدرت کدنویسی مدلهای کوچک را به شدت…

یک مطالعه جدید هشدار میدهد که هوش مصنوعی زاینده با تغییر معیارهای ارزیابی، در حال حذف تدریجی مهارتهای تخصصی استخدامکنندگان است. در این روند، بهرهوری اندک در برابر زوال…

پژوهشگران دریافتند که مدلهای UDDM مانند حافظههای تداعی عمل میکنند. اکنون میتوان با پایش آنتروپی شرطی، لحظهی دقیق گذار مدل از حفظ کردن دادهها به تعمیم اطلاعات را بهصورت کمی…

روشی جدید به نام Random Cloud اجازه میدهد بدون نیاز به آموزش اولیه، کوچکترین و بهینترین ساختار شبکههای عصبی شناسایی شوند. این متد با جایگزینی چرخه پرهزینه…

پژوهشگران ابزار متنباز HalluCiteChecker را برای شناسایی ارجاعات جعلی در مقالات علمی معرفی کردند. این ابزار سبک، بدون نیاز به GPU و بهصورت آفلاین روی CPUهای معمولی اجرا میشود تا…

یک چارچوب سلسلهمراتبی جدید با ترکیب قوانین قطعی و یادگیری تقویتشده، ایمنی پهپادها را در عملیات امداد و نجات متحول کرده است. این سیستم حتی بدون پیشآموزش، نرخ برخوردها را کاهش…

ViCrop-Det یک چارچوب استنتاج بدون نیاز به آموزش است که با استفاده از آنتروپی توجه، دقت تشخیص اشیاء کوچک را بهطور چشمگیری افزایش میدهد. این متد بدون تغییر در وزنهای مدل، mAP را…

یک مدل تخصصی Qwen2.5-7B در تریاژ پزشکی از GPT-4o پیشی گرفت. این نتیجه ثابت میکند تنظیم دقیق روی دادههای بالینی بسیار موثرتر از تکیه بر مدلهای عمومی عظیم است.