موضوع

آموزش توزیع‌شده

روشی برای آموزش مدل‌های هوش مصنوعی با استفاده از چندین پردازنده یا سرور به‌صورت همزمان

۴۵ مقاله منتشر شده

موتور ترنسفورمر انویدیا با هسته‌های یکپارچه، BF16 و FP8 برای تسریع آموزش مدل‌های ترنسفورمر و بنچمارک GPU

رویکرد سخت‌افزاری انویدیا در برابر پیاده‌سازی‌های استاندارد PyTorch

انویدیا با ترکیب هسته‌های گرافیکی ادغام‌شده و دقت ۸ بیتی (FP8)، حافظه و تأخیر آموزش مدل‌های زبانی بزرگ را به‌شدت کاهش داد. این رویکرد سخت‌افزار-آگاه، جایگزینی بهینه برای…

۷ دقیقه خواندن۱

اجاره GPU انویدیا B300 برای آموزش مدل‌های زبانی بزرگ: راهنمای عملی

آموزش کاربردیدیروز

۴ گام بهینه‌سازی هزینه در اجاره ابری پردازنده‌های B300

دسترسی به پردازنده‌های Blackwell-based B300 از طریق اجاره ابری، هزینه‌های هنگفت سخت‌افزاری اولیه را برای توسعه‌دهندگان حذف می‌کند. این راهنما فرآیند استقرار، از انتخاب زیرساخت تا…

۵ دقیقه خواندن

یادگیری فعال حفظ حریم خصوصی برای زنجیره تأمیر تولید دایره‌ای با رعایت چند حوزه قضایی

آموزش کاربردیپریروز

چگونه PPAL آموزش مدل‌ها را با قوانین GDPR و CCPA سازگار کرد؟

یک چارچوب جدید به نام یادگیری فعال حافظه‌محفوظ (PPAL) امکان آموزش مدل‌های هوش مصنوعی را بدون اشتراک‌گذاری داده‌های خام بین کشورهای مختلف فراهم می‌کند. این سیستم با ترکیب یادگیری…

۶ دقیقه خواندن۲

مدیریت GPU: چرا پردازنده‌های بیکار، هواپیماهای زمین‌گیرشده جدید هستند

تحلیل و بررسی تخصصیپریروز

مدیریت لایه‌های نرم‌افزاری در برابر خرید سخت‌افزار برای رشد هوش مصنوعی

محدودیت رشد هوش مصنوعی از کیفیت مدل‌ها به بهره‌وری سخت‌افزار تغییر یافته است. سازمان‌ها اکنون به‌جای خرید سخت‌افزار بیشتر، بر لایه‌های ارکستراسیون برای جلوگیری از بیکار ماندن…

۱۰ دقیقه خواندن۱

خرید Anyscale توسط Nscale برای ارتقا در پشته محاسبات هوش مصنوعی

اخبار کوتاه روزانهپریروز

«کنترل کامل محاسبات AI»؛ هدف Nscale از تصاحب Anyscale

شرکت Nscale با خرید Anyscale، سازنده چارچوب Ray، قصد دارد از تولید برق و سخت‌افزار تا نرم‌افزارهای مدیریت توزیع‌شده را یکپارچه کند. این استراتژی با هدف کاهش هزینه‌ها و حذف…

۴ دقیقه خواندن

چارچوب آموزش یکپارچه تایسن برای نمونه‌برداری سوداگرانه در مدل‌های زبانی بزرگ

آموزش کاربردیپریروز

تنسنت: چارچوب AngelSpec سرعت رمزگشایی را ۲.۴ برابر کرد

تنسنت چارچوب متن‌باز AngelSpec را برای بهینه‌سازی رمزگشایی گمانه‌زنانه در باره‌های گفتگو و فنی معرفی کرد. این ابزار با استفاده از دو مدل پیش‌بین مجزا، توازن بین تولید متن‌های…

۶ دقیقه خواندن۱

لوگوی شرکت مون‌شات (Moonshot AI) و نام مدل کیمی کی۳ (Kimi K3) در کنار هم

اخبار کوتاه روزانه۳ روز پیش

Moonshot AI وزن‌های مدل ۲.۸ تریلیون پارامتری Kimi K3 را منتشر کرد

شرکت Moonshot AI وزن‌های مدل Kimi K3 را با معماری ترکیب خبره‌ها به صورت باز منتشر کرد. این مدل تحت یک لایسنس جدید عرضه شده که تا رسیدن درآمد سالانه شرکت کاربر به ۲۰ میلیون دلار،…

۵ دقیقه خواندن

ایلیان ۱۴۵ میلیون دلار سری C جمع‌آوری کرد برای ورود به فناوری اتصالات نوری

اخبار کوتاه روزانه۳ روز پیش

سرمایه‌گذاری ۱۴۵ میلیون دلاری Eliyan برای عبور از گلوگاه‌های سخت‌افزاری AI

شرکت Eliyan با جذب ۱۴۵ میلیون دلار سرمایه و رسیدن به ارزش ۱ میلیارد دلاری، بر توسعه پیوندهای الکترو-اپتیکال برای مراکز داده تمرکز می‌کند. این استراتژی هدفش رفع محدودیت‌های پهنای…

۴ دقیقه خواندن۱

محیط اجرای توزیع‌شده برای عامل‌های هوش مصنوعی در مقیاس بزرگ (متن‌باز، راست)

آموزش کاربردی۴ روز پیش

Kimi K3: اجرای هزاران محیط ایزوله برای آموزش عامل‌های هوشمند

تیم Kimi و kvcache-ai ابزار متن‌باز AgentENV را برای رفع گلوگاه‌های تأخیر در آموزش عامل‌های هوش مصنوعی معرفی کردند. این پلتفرم با استفاده از میکرو-ماشین‌های مجازی، امکان اجرای…

۱ دقیقه خواندن

شما هم می‌توانستید به «توجه دلتا کیمی» برسید | دابل‌ورد

آموزش کاربردی۴ روز پیش

معماری KDA: حذف تداخل حافظه با قانون دلتا در توالی‌های بلند

معماری جدید KDA با جایگزینی به‌روزرسانی‌های جمعی ساده با قانون دلتا و فراموشی کانال‌به‌کانال، مشکل تداخل در حافظه‌های با اندازه ثابت را برطرف می‌کند. این رویکرد به مدل‌ها اجازه…

۱۵ دقیقه خواندن۲

سیستم توزیع‌شده AgentENV برای آموزش یادگیری تقویتی عامل‌محور Kimi K3 منتشر شد.

تحلیل و بررسی تخصصی۵ روز پیش

درون معماری AgentENV؛ تابه‌بندی مدل‌های عظیم با Firecracker

تیم Kimi و kvcache-ai پلتفرم متن‌باز AgentENV را برای مقیاس‌دهی یادگیری تقویتی (RL) در مدل‌های عظیم معرفی کردند. این سامانه با استفاده از ماشین‌های مجازی بسیار کوچک (microVMs)،…

۵ دقیقه خواندن

مقالات برتر هوش مصنوعی در هاگینگ فیس - ۲۶ ژوئیه ۲۰۲۶

اخبار کوتاه روزانه۶ روز پیش

۳ مقاله از Hugging Face برای ارتقای استدلال عامل‌ها و زیرساخت LLM

پژوهش‌های تازه در Hugging Face مدل‌های خود-اصلاح‌گر و روش‌های آموزش DeepSeek-V4 روی سخت‌افزارهای غیرانویدیا را معرفی کردند. این پیشرفت‌ها شکاف‌های حیاتی در خودمختاری عامل‌های هوش…

۳ دقیقه خواندن