
توجه R-SWA در برابر استاندارد؛ پایان رشد خطی حافظه در OCR
بایدو مدل Unlimited OCR را معرفی کرد؛ یک مدل ۳ میلیارد پارامتری که با جایگزینی توجه استاندارد با R-SWA، مشکل افزایش حافظه در پردازش اسناد طولانی را حل کرده است. این مدل اجازه…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۳۳ مقاله منتشر شده

بایدو مدل Unlimited OCR را معرفی کرد؛ یک مدل ۳ میلیارد پارامتری که با جایگزینی توجه استاندارد با R-SWA، مشکل افزایش حافظه در پردازش اسناد طولانی را حل کرده است. این مدل اجازه…

شرکت Krea مدل Krea 2 را با ۱۲.۹ میلیارد پارامتر منتشر کرد که از نظر کیفیت با مدلهای بستهٔ پیشرو رقابت میکند. این عرضه شامل یک مدل پایه برای تنظیم دقیق و یک نسخه Turbo برای…

یک بنچمارک گسترده با ۹۳۶ اجرا نشان میدهد که جستوجوی متنی برای کارهای ساده کافی است، اما برای بازسازی کدهای پیچیده، گرافهای ساختاری ضروری هستند. استفاده از این ابزارها هزینهها…

شرکت آنتروپیک علیبابا را به سرقت گسترده قابلیتهای مدل Claude از طریق حملات «تقطیری» متهم کرد. این حادثه نشان میدهد مدلهای پیشرو حتی بدون نشت وزنها، از طریق رابطهای…

یک معماری مرجع جدید برای عاملهای هوش مصنوعی، پیشنهاد از اجرا را جدا میکند تا از اقدامات غیرقابلبازگشت ناشی از پرامپتهای مخرب جلوگیری شود. این سیستم با ایجاد یک مرز «بسته در…

شرکت Gradium با معرفی معماری دو-مدلی stt-translate و s2s-translate، تأخیر در ترجمهٔ همزمان گفتار را به ۳ ثانیه کاهش داد. این سامانه با عبور از مدلهای سنتی متنی، دقت و سرعت…

چارچوب OpenHarness با تفکیک لایهی استدلال مدل از محیط اجرای ابزارها، استقرارهای تجاری عاملهای هوش مصنوعی را ایمنتر میکند. این سیستم از طریق مجوزهای لایهبندی شده و مدیریت پویا…

هوش مصنوعی عاملمحور از مدلهای واکنشی که فقط به پرامپت پاسخ میدهند، فراتر رفته و به سامانههایی تبدیل شده که میتوانند برنامهریزی کنند و ابزارهای خارجی را به کار بگیرند. این…

OpenAI نخستین پردازنده اختصاصی خود به نام Jalapeño را برای بهینهسازی استنتاج مدلها معرفی کرد. این تراشه که با همکاری Broadcom توسعه یافته، قصد دارد وابستگی این شرکت به GPUهای…

فیگما برای حفظ جایگاه خود در برابر ابزارهای تولید خودکار رابط کاربری، بوم طراحی را به محیطی برای اجرای کد و موشن تبدیل کرده است. این شرکت بهجای ساخت مدل اختصاصی، بر تقویت قضاوت…

چارچوب جدید Strands Evals با تزریق خطاهای کنترلشده در ابزارها، پایداری عاملهای هوش مصنوعی را میسنجد. این روش به توسعهدهندگان کمک میکند تا خطاهای خاموش و زمانبندی را پیش از…

آمازون از طریق Strands Labs ابزار AI Functions را معرفی کرد که در آن توسعهدهندگان بهجای نوشتن بدنه تابع، تنها هدف و خروجی صحیح را تعریف میکنند. این سیستم با استفاده از یک حلقه…