پرش به محتوای اصلی

موضوع

آموزش توزیع‌شده

روشی برای آموزش مدل‌های هوش مصنوعی با استفاده از چندین پردازنده یا سرور به‌صورت همزمان

۳ مقاله منتشر شده

حذف وابستگی استراتژی به اجرا؛ رویکرد Piper برای ساده‌سازی موازی‌سازی توزیع‌شده

حذف وابستگی استراتژی به اجرا؛ رویکرد Piper برای ساده‌سازی موازی‌سازی توزیع‌شده

سیستم Piper با جداسازی استراتژی‌های آموزش از پیاده‌سازی زمان اجرا، پیچیدگی‌های موازی‌سازی مدل‌های عظیم را کاهش می‌دهد. این سیستم از یک نمایش میانی (IR) مبتنی بر گراف برای اجرای…

۱ دقیقه خواندن
چرا GASLoC در آموزش مدل‌های زبانی بر سخت‌افزارهای ناهمگن از DiLoCo پیشی می‌گیرد؟

چرا GASLoC در آموزش مدل‌های زبانی بر سخت‌افزارهای ناهمگن از DiLoCo پیشی می‌گیرد؟

پژوهشگران الگوریتم GASLoC را برای پیش‌آموزش غیرمتمرکز مدل‌های زبانی معرفی کرده‌اند که گلوگاه‌های ارتباطی همگام را حذف می‌کند. این چارچوب به‌ویژه در محیط‌هایی با سخت‌افزارهای متنوع…

۱ دقیقه خواندن
ArXiv: کاهش ۲۵.۵ درصدی زمان آموزش مدل‌های چند-GPU با روش Shaping حافظه مشترک

ArXiv: کاهش ۲۵.۵ درصدی زمان آموزش مدل‌های چند-GPU با روش Shaping حافظه مشترک

پژوهشگران روشی برای هم‌پوشانی (Overlap) محاسبات و ارتباطات در محیط‌های چند-GPU ابداع کرده‌اند که زمان اجرای کل را تا ۲۵.۵٪ کاهش می‌دهد. این دستاورد بدون تغییر در کتابخانه‌های…

۱ دقیقه خواندن