پرخواننده‌ترین‌ها

چرا برای بهینه‌سازی واقعی هوش مصنوعی باید پایتون را کنار گذاشت؟

پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی می‌کند. این ابزار به توسعه‌دهندگان می‌آموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر پیچیدگی‌های حافظه GPU غلبه کنند.

۹ خرداد ۱۴۰۵۲ دقیقه خواندن

۲۴۰۲

تحلیل و بررسی تخصصی

بنچمارک CVE-Bench: نرخ موفقیت GPT-5.5 در رفع آسیب‌پذیری‌های امنیتی ۵۰٪ است

مدل‌های پیشرو همچنان در رفع نیمی از آسیب‌پذیری‌های امنیتی واقعی ناتوان‌اند. بنچمارک CVE-Bench نشان می‌دهد که «استدلال امنیتی» در این مدل‌ها بیشتر شبیه به تطبیق الگو است تا تحلیل عمیق کد.

چرا برای بهینه‌سازی واقعی هوش مصنوعی باید پایتون را کنار گذاشت؟

بنچمارک CVE-Bench: نرخ موفقیت GPT-5.5 در رفع آسیب‌پذیری‌های امنیتی ۵۰٪ است

چگونه GPT-Rosalind سرعت شناسایی ویروس‌های جدید را برای دولت‌ها افزایش می‌دهد؟

چگونه StepFun با معماری MoE سرعت استنتاج مدل‌های چندوجهی را بالا برد؟

Braintrust: تبدیل درخواست‌های مشتری به کد در چند دقیقه با Codex

درون قرارداد ۳۲۲ هزار پوندی بریتانیا برای تشخیص سن مهاجران با هوش مصنوعی

چگونه به‌روزرسانی‌های جدید Gemini از اتمام سریع سهمیه کاربران جلوگیری می‌کند؟

OpenAI: مدل‌های GPT-4.5 و o3 تا اوت ۲۰۲۶ بازنشسته می‌شوند

داده‌های متا: ۹۲.۷٪ از قضایای ریاضی در ATLAS با موفقیت اثبات شدند

چگونه «هارنس» یا محیط ارزیابی، توانایی واقعی مدل‌های پیشرو را بازتعریف می‌کند؟

درون استراتژی Mistral برای مالکیت کامل زنجیره تأمین هوش مصنوعی اروپا

CogCAPTCHA30 و شکاف فرآیندی: چرا مدل‌های پیشرو در استدلال کمتر شبیه انسان هستند؟

چرا XCENA برای کاهش هزینه‌های استنتاج، محاسبات را به درون حافظه منتقل می‌کند؟

چگونه Interlock جلوی مسمومیت ابزارها در پروتکل MCP را می‌گیرد؟

چرا وزن‌های مدل، گلوگاه واقعی عامل‌های هوش مصنوعی نیستند؟

درون AppFunctions: استراتژی گوگل برای حذف رابط کاربری در عصر عامل‌های هوش مصنوعی

چرا استارتاپ Shift نظافت رایگان خانه‌ها را با داده‌های ویدئویی معامله می‌کند؟

چرا torch.compile همیشه سرعت اجرای مدل‌های شما را افزایش نمی‌دهد؟

چرا OpenAI دیگر به مسدود کردن پرامپت‌های خطرناک اکتفا نمی‌کند؟

چرا Firefly Assistant به جای تولید تصویر، ابزارهای فتوشاپ را مدیریت می‌کند؟

چرا سیستم رتبه‌بندی هوش مصنوعی آمازون به جای بهره‌وری، هزینه آورد؟

گزارش مالی انویدیا: سهم خریداران غیر-هایپر-اسکیلر به ۵۰٪ درآمد مراکز داده رسید

چرا تنوع مدل‌ها دیگر مزیت رقابتی ارائه‌دهندگان MaaS نیست؟

چگونه ECC با بارگذاری تنبل، ۲۴۹ مهارت تخصصی را در پنجره متنی Claude جای داد؟

LFM2.5-8B-A1B: نمره ۹۱.۸۴ در IFEval با تنها ۱.۵ میلیارد پارامتر فعال

سازوکار تزریق پنهان پرامپت در jqwik برای حذف خودکار کدها توسط عامل‌ها

درون استراتژی ۹۶۵ میلیارد دلاری Anthropic برای تبدیل شدن به غول سازمانی

Claude Opus 4.8: کاهش ۴ برابری خطاهای کدنویسی با متد آموزش صداقت

قمار ۷۵ میلیون دلاری Asana برای تبدیل مدیریت پروژه به سیستم‌عامل عامل‌ها

سازوکار امتیازدهی موازی در A3M Router که هزینه‌های استنتاج را ۳.۸ برابر کاهش داد