لینکدین: افزایش ۷۵ برابری سرعت حل مسائل بهینه‌سازی با استفاده از PyTorch

اگر تصور می‌کنید پای‌تورچ (PyTorch) تنها برای آموزش مدل‌های زبانی است، باید نگاهی به زیرساخت جدید لینکدین (LinkedIn) بیندازید. این شرکت ثابت کرد که شتاب‌دهنده‌های سخت‌افزاری می‌توانند مسائل کلاسیک بهینه‌سازی را در مقیاسی حل کنند که پیش‌تر غیرممکن پنداشته می‌شد.

همان‌طور که در بررسی‌های پیشین ما درباره‌ی بهینه‌سازی مراکز داده اشاره کردیم، مدیریت متغیرها در مقیاس تریلیونی همواره یک گلوگاه سخت‌افزاری بوده است. اپلیکیشن‌های مدرن وب برای تصمیم‌گیری‌های آنی در مورد تطبیق شغلی یا فرکانس ارسال ایمیل، به چیزی فراتر از پیش‌بینی نیاز دارند: آن‌ها به تصمیمات بهینه‌سازی شده در لحظه نیاز دارند. طبق گزارش منتشرشده در ۱ ژوئن ۲۰۲۶، روش‌های سنتی برنامه‌ریزی خطی (Linear Programming) مانند روش سیمپلکس یا نقاط داخلی در این مقیاس شکست می‌خورند، زیرا تجزیه ماتریس‌ها (Matrix Factorization) در آن‌ها بیش از حد هزینه‌بر است.

به نقل از مطالعه موردی PyTorch، لینکدین برای عبور از این بن‌بست، ابزاری به نام DuaLip-PyTorch توسعه داد که جایگزین پشته قدیمی Scala/Spark شد. این سیستم به جای تجزیه‌های گران‌قیمت، از روش‌های مرتبه اول نخست-دوگان (First-order Primal-Dual methods) استفاده می‌کند که بر پایه اطلاعات گرادینت و ضرب ماتریس-بردار عمل می‌کنند.

جزئیات فنی این پیاده‌سازی عبارتند از:

استفاده از عملیات تنسورهای پراکنده (Sparse Tensors) برای مدیریت میلیاردها تا تریلیون‌ها متغیر.
استفاده از کرنل‌های تصویرسازی دسته‌ای (Batched Projection Kernels) و همگام‌سازی توزیع‌شده از طریق الگوهای all-reduce و broadcast.
بهره‌گیری از شتاب‌دهنده‌های همگرایی شامل گونه‌های AGD و FISTA.

این تغییر معماری منجر به افزایش ۷۵ برابری سرعت اجرای هر تکرار (Iteration) در مقایسه با پیاده‌سازی‌های مبتنی بر CPU شد.

از دیدگاه مهندسی، این گذار فرضیه قدیمی مبنی بر «صرفاً یادگیری عمیق بودن» PyTorch را می‌شکند. لینکدین با مدل‌سازی ساختاری یک حل‌کننده بهینه‌سازی به‌صورت یک شبکه عصبی — با استفاده از انتزاع‌های تنسوری و کرنل‌های GPU — شکاف بین یادگیری ماشین و بهینه‌سازی کلاسیک را پر کرده است. این امر هزینه استقرار محدودیت‌های پیچیده جدید در محیط عملیاتی را به‌شدت کاهش می‌دهد.

گام بعدی شما

بررسی جزئیات فنی کامل در گزارش DuaLip-GPU در وب‌سایت arXiv.
تحلیل پیاده‌سازی متن‌باز این سیستم در مخازن GitHub.
ارزیابی جایگزینی روش‌های تجزیه ماتریس با روش‌های مرتبه اول در سیستم‌های بهینه‌سازی داخلی خود.

اما این تنها بخشی از تحول در زیرساخت‌های پردازشی است؛ تحلیل ما درباره‌ی اثر این تغییر بر هزینه عملیاتی مراکز داده را دنبال کنید.

لینکدین: افزایش ۷۵ برابری سرعت حل مسائل بهینه‌سازی با استفاده از PyTorch

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

لینکدین: افزایش ۷۵ برابری سرعت حل مسائل بهینه‌سازی با استفاده از PyTorch

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

چگونه همگام‌سازی دلتای پراکنده حجم انتقال داده در آموزش RL را ۹۸٪ کاهش داد؟

Recursive Superintelligence: ۶۵۰ میلیون دلار برای حذف انسان از چرخه پژوهش AI

IBM: مدل ۹۷ میلیون پارامتری در بازیابی چندزبانه از رقبای ۳۰۰ میلیونی پیشی گرفت

گفتگو

بسته‌ی هفتگی دات‌هوش