چرا برای بهینهسازی واقعی هوش مصنوعی باید پایتون را کنار گذاشت؟
پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی میکند. این ابزار به توسعهدهندگان میآموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر…
دستهبندی
راهنماهای گامبهگام، دورهها و آموزشهای کاربردی استفاده از هوش مصنوعی — از مهندسی پرامپت تا فاینتیون و RAG.
۱٬۸۷۳ مقاله منتشر شده
پروژه tiny-vllm یک موتور آموزشی مبتنی بر C++ و CUDA است که معماری vLLM را بازسازی میکند. این ابزار به توسعهدهندگان میآموزد چگونه استنتاج Llama 3.2 را از صفر پیاده کنند و بر…
مدلهای پیشرو همچنان در رفع نیمی از آسیبپذیریهای امنیتی واقعی ناتواناند. بنچمارک CVE-Bench نشان میدهد که «استدلال امنیتی» در این مدلها بیشتر شبیه به تطبیق الگو است تا تحلیل…
شرکت StepFun مدل Step 3.7 Flash را معرفی کرد؛ یک مدل ۱۹۸ میلیارد پارامتری بهینه برای پردازندههای NVIDIA. این مدل استدلال چندوجهی در مقیاس سازمانی را با پنجره متنی ۲۵۶ هزار توکنی…
متا کتابخانه ATLAS را منتشر کرد؛ مجموعهای عظیم از متون ریاضی که توسط هوش مصنوعی به کد Lean 4 تبدیل شدهاند. این پایگاه داده با بیش از ۴۶ هزار قضیه اثباتشده، زیربنایی مقیاسپذیر…
سید معاذ احمد ابزاری به نام Interlock ساخت تا از نشت دادهها در عاملهای هوش مصنوعی جلوگیری کند. این سیستم با نظارت لحظهای بر ابزارهای MCP، حملات تزریق پرامپت و تغییرات مخرب را…
گوگل با معرفی کتابخانه AppFunctions در اندروید ۱۶، به اپلیکیشنها اجازه میدهد منطق داخلی خود را مستقیماً به عنوان ابزاری برای عاملهای هوش مصنوعی ارائه دهند. این تغییر، رابطهای…
راهنمایی فنی برای استفاده از torch.profiler جهت شناسایی گلوگاههای پردازشی در PyTorch. این ابزار نشان میدهد چگونه هزینههای پنهان CPU در torch.compile میتواند بهرهوری مدل را…
افزونه Everything Claude Code (ECC) با تبدیل Claude به یک تیم توسعه چند-عاملی، ۲۰۰ هزار ستاره در گیتهاب گرفت. این ابزار با استفاده از مکانیسم بارگذاری تنبل، ۲۴۹ مهارت تخصصی را…
پروژه متنباز A3M Router برای نخستین بار رتبه اول جدول RouterArena را از رقبای تجاری ربود. این ابزار با استفاده از یک سازوکار امتیازدهی موازی، هزینههای عملیاتی را بهشدت کاهش…
ابزار ktx یک لایهی محلی است که به عاملهای هوش مصنوعی یاد میدهد دادههای انبار را با معیارهای تأییدشده استخراج کنند. این سیستم نیاز به بازنویسی منطق SQL در هر درخواست را از بین…
Claude Code با استفاده از جریانهای کاری پویا، توانست پروژه Bun را در ۱۱ روز از Zig به Rust منتقل کند. این دستاورد با دقت ۹۹.۸ درصد در تستها به دست آمد و نشاندهنده گذار از…
گوگل با معرفی برد Coral، امکان اجرای محلی مدل Gemma 3 270M را روی سختافزار RISC-V فراهم کرد. این اقدام هدفش کاهش وابستگی به ابر در گجتهای پوشیدنی و حذف هزینههای API است.