تحلیل و بررسی تخصصی

چرا جایگزینی پشتیبانی انسانی با هوش مصنوعی در متا یک کابوس امنیتی شد؟

هکرهای حرفه‌ای با سوءاستفاده از یک نقص امنیتی در چت‌بات پشتیبانی متا، حساب‌های سطح بالای اینستاگرام از جمله صفحه کاخ سفید اوباما را سرقت کردند. این حمله با دور زدن احراز هویت دو…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۴ هفته پیش

کاهش ۱۰۰۰ برابری هزینه تأیید عامل‌های حقوقی با DeepSeek-V4-Flash

شرکت‌های LangChain و Harvey چارچوبی برای کاهش هزینه‌ی تأیید صحت عملکرد عامل‌های حقوقی پیچیده معرفی کرده‌اند. یافته‌های آن‌ها نشان می‌دهد مدل DeepSeek-V4-Flash می‌تواند با هزینه‌ای…

۳ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

چرا برای بهینه‌سازی واقعی هوش مصنوعی باید پایتون را کنار گذاشت؟

پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی می‌کند. این ابزار به توسعه‌دهندگان می‌آموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۴ هفته پیش

بنچمارک CVE-Bench: نرخ موفقیت GPT-5.5 در رفع آسیب‌پذیری‌های امنیتی ۵۰٪ است

مدل‌های پیشرو همچنان در رفع نیمی از آسیب‌پذیری‌های امنیتی واقعی ناتوان‌اند. بنچمارک CVE-Bench نشان می‌دهد که «استدلال امنیتی» در این مدل‌ها بیشتر شبیه به تطبیق الگو است تا تحلیل…

۲ دقیقه خواندن

اخبار کوتاه روزانه۴ هفته پیش

چگونه GPT-Rosalind سرعت شناسایی ویروس‌های جدید را برای دولت‌ها افزایش می‌دهد؟

شرکت OpenAI دسترسی رایگان به مدل تخصصی علوم زیستی خود، GPT-Rosalind را برای شرکای دولتی و غیرانتفاعی تأییدشده فراهم کرد. هدف این برنامه تسریع در تولید واکسن و ایجاد سامانه‌های…

۲ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

داده‌های متا: ۹۲.۷٪ از قضایای ریاضی در ATLAS با موفقیت اثبات شدند

متا کتابخانه ATLAS را منتشر کرد؛ مجموعه‌ای عظیم از متون ریاضی که توسط هوش مصنوعی به کد Lean 4 تبدیل شده‌اند. این پایگاه داده با بیش از ۴۶ هزار قضیه اثبات‌شده، زیربنایی مقیاس‌پذیر…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۴ هفته پیش

چگونه «هارنس» یا محیط ارزیابی، توانایی واقعی مدل‌های پیشرو را بازتعریف می‌کند؟

شرکت OpenAI در یک دستورالعمل فنی استدلال می‌کند که توانایی مدل‌های پیشرو یک مقدار ثابت نیست، بلکه متغیری وابسته به «هارنس» (Harness) یا همان محیط، ابزارها و بودجه محاسباتی است.…

۳ دقیقه خواندن

تحلیل و بررسی تخصصی۴ هفته پیش

CogCAPTCHA30 و شکاف فرآیندی: چرا مدل‌های پیشرو در استدلال کمتر شبیه انسان هستند؟

پژوهشی جدید با معرفی «تست تورینگ فرآیندی» نشان می‌دهد که مدل‌های پیشرو با وجود ارائه پاسخ‌های صحیح، مسیری کاملاً متفاوت از انسان برای رسیدن به جواب طی می‌کنند. این مطالعه فاش…

۳ دقیقه خواندن

اخبار کوتاه روزانه۴ هفته پیش

چرا XCENA برای کاهش هزینه‌های استنتاج، محاسبات را به درون حافظه منتقل می‌کند؟

استارتاپ XCENA با جذب ۱۳۵ میلیون دلار سرمایه، تراشه‌ی MX1 را برای حذف گلوگاه حافظه در هوش مصنوعی توسعه می‌دهد. این فناوری با انتقال پردازش به درون ماژول‌های حافظه، تعداد سرورهای…

۲ دقیقه خواندن

آموزش کاربردی۴ هفته پیش

چگونه Interlock جلوی مسمومیت ابزارها در پروتکل MCP را می‌گیرد؟

سید معاذ احمد ابزاری به نام Interlock ساخت تا از نشت داده‌ها در عامل‌های هوش مصنوعی جلوگیری کند. این سیستم با نظارت لحظه‌ای بر ابزارهای MCP، حملات تزریق پرامپت و تغییرات مخرب را…

۲ دقیقه خواندن

تحلیل و بررسی تخصصی۴ هفته پیش

چرا وزن‌های مدل، گلوگاه واقعی عامل‌های هوش مصنوعی نیستند؟

پژوهشگران استنفورد و متا استدلال می‌کنند که عامل‌های هوش مصنوعی تنها یک مدل زبانی نیستند، بلکه ترکیبی از مدل و یک «هارنس» نرم‌افزاری‌اند. این لایه‌ی کد اجرایی است که تداوم وضعیت،…

۳ دقیقه خواندن

آموزش کاربردیماه گذشته

چرا torch.compile همیشه سرعت اجرای مدل‌های شما را افزایش نمی‌دهد؟

راهنمایی فنی برای استفاده از torch.profiler جهت شناسایی گلوگاه‌های پردازشی در PyTorch. این ابزار نشان می‌دهد چگونه هزینه‌های پنهان CPU در torch.compile می‌تواند بهره‌وری مدل را…

۳ دقیقه خواندن