
گزارش Sakana AI و NVIDIA: افزایش ۲۱.۹ درصدی سرعت آموزش LLM با فرمت داده TwELL
پژوهشگران Sakana AI و NVIDIA با معرفی TwELL، فرمت دادهای جدید و کرنل CUDA بهینه، سرعت آموزش مدلهای زبانی را ۲۱.۹ درصد افزایش دادند. این سیستم بدون کاهش دقت مدل، بهرهوری…










