چرا جایگزینی پشتیبانی انسانی با هوش مصنوعی در متا یک کابوس امنیتی شد؟
هکرهای حرفهای با سوءاستفاده از یک نقص امنیتی در چتبات پشتیبانی متا، حسابهای سطح بالای اینستاگرام از جمله صفحه کاخ سفید اوباما را سرقت کردند. این حمله با دور زدن احراز هویت دو…
دستهبندی
تحلیلهای عمیق مدلها، مقالات و بنچمارکها — پیشچاپها، ارزیابیها، مدلهای زبانی پیشرو و پژوهش همراستاسازی.
۱٬۶۷۸ مقاله منتشر شده
هکرهای حرفهای با سوءاستفاده از یک نقص امنیتی در چتبات پشتیبانی متا، حسابهای سطح بالای اینستاگرام از جمله صفحه کاخ سفید اوباما را سرقت کردند. این حمله با دور زدن احراز هویت دو…
شرکتهای LangChain و Harvey چارچوبی برای کاهش هزینهی تأیید صحت عملکرد عاملهای حقوقی پیچیده معرفی کردهاند. یافتههای آنها نشان میدهد مدل DeepSeek-V4-Flash میتواند با هزینهای…
پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی میکند. این ابزار به توسعهدهندگان میآموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر…
مدلهای پیشرو همچنان در رفع نیمی از آسیبپذیریهای امنیتی واقعی ناتواناند. بنچمارک CVE-Bench نشان میدهد که «استدلال امنیتی» در این مدلها بیشتر شبیه به تطبیق الگو است تا تحلیل…
شرکت OpenAI دسترسی رایگان به مدل تخصصی علوم زیستی خود، GPT-Rosalind را برای شرکای دولتی و غیرانتفاعی تأییدشده فراهم کرد. هدف این برنامه تسریع در تولید واکسن و ایجاد سامانههای…
متا کتابخانه ATLAS را منتشر کرد؛ مجموعهای عظیم از متون ریاضی که توسط هوش مصنوعی به کد Lean 4 تبدیل شدهاند. این پایگاه داده با بیش از ۴۶ هزار قضیه اثباتشده، زیربنایی مقیاسپذیر…
شرکت OpenAI در یک دستورالعمل فنی استدلال میکند که توانایی مدلهای پیشرو یک مقدار ثابت نیست، بلکه متغیری وابسته به «هارنس» (Harness) یا همان محیط، ابزارها و بودجه محاسباتی است.…
پژوهشی جدید با معرفی «تست تورینگ فرآیندی» نشان میدهد که مدلهای پیشرو با وجود ارائه پاسخهای صحیح، مسیری کاملاً متفاوت از انسان برای رسیدن به جواب طی میکنند. این مطالعه فاش…
استارتاپ XCENA با جذب ۱۳۵ میلیون دلار سرمایه، تراشهی MX1 را برای حذف گلوگاه حافظه در هوش مصنوعی توسعه میدهد. این فناوری با انتقال پردازش به درون ماژولهای حافظه، تعداد سرورهای…
سید معاذ احمد ابزاری به نام Interlock ساخت تا از نشت دادهها در عاملهای هوش مصنوعی جلوگیری کند. این سیستم با نظارت لحظهای بر ابزارهای MCP، حملات تزریق پرامپت و تغییرات مخرب را…
پژوهشگران استنفورد و متا استدلال میکنند که عاملهای هوش مصنوعی تنها یک مدل زبانی نیستند، بلکه ترکیبی از مدل و یک «هارنس» نرمافزاریاند. این لایهی کد اجرایی است که تداوم وضعیت،…
راهنمایی فنی برای استفاده از torch.profiler جهت شناسایی گلوگاههای پردازشی در PyTorch. این ابزار نشان میدهد چگونه هزینههای پنهان CPU در torch.compile میتواند بهرهوری مدل را…