GPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXINGGPT-4o LATENCY240msCLAUDE OPUS 4.7ONLINENVDA+1.2%MISTRAL LARGE 2STREAMINGOPENAI API99.97% UPTIMEGROQ MIXTRAL580 tok/sGEMINI 2.5 PROCTX 2MANTHROPIC STATUSOKTSMC+0.4%PERPLEXITYINDEXING
پرش به محتوای مقاله

لینکدین: افزایش ۷۵ برابری سرعت حل مسائل بهینه‌سازی با استفاده از PyTorch

·۱۳ خرداد ۱۴۰۵۵ دقیقه مطالعه
چگونه لینکدین با پای‌تورچ مسائل بهینه‌سازی در مقیاس عظیم را حل می‌کند
چگونه لینکدین با پای‌تورچ مسائل بهینه‌سازی در مقیاس عظیم را حل می‌کند
اشتراک‌گذاری
واقعاً چه چیز جدید است؟

به‌کارگیری روش‌های مرتبه اول نخست-دوگان بر روی GPU برای دور زدن گلوگاه تجزیه ماتریس در برنامه‌ریزی خطی مقیاس تریلیونی؛ تبدیل یک حل‌کننده کلاسیک به ساختار جریان داده تنسوری.

اگر تصور می‌کنید پای‌تورچ (PyTorch) تنها برای آموزش مدل‌های زبانی است، باید نگاهی به زیرساخت جدید لینکدین (LinkedIn) بیندازید. این شرکت ثابت کرد که شتاب‌دهنده‌های سخت‌افزاری می‌توانند مسائل کلاسیک بهینه‌سازی را در مقیاسی حل کنند که پیش‌تر غیرممکن پنداشته می‌شد.

همان‌طور که در بررسی‌های پیشین ما درباره‌ی بهینه‌سازی مراکز داده اشاره کردیم، مدیریت متغیرها در مقیاس تریلیونی همواره یک گلوگاه سخت‌افزاری بوده است. اپلیکیشن‌های مدرن وب برای تصمیم‌گیری‌های آنی در مورد تطبیق شغلی یا فرکانس ارسال ایمیل، به چیزی فراتر از پیش‌بینی نیاز دارند: آن‌ها به تصمیمات بهینه‌سازی شده در لحظه نیاز دارند. طبق گزارش منتشرشده در ۱ ژوئن ۲۰۲۶، روش‌های سنتی برنامه‌ریزی خطی (Linear Programming) مانند روش سیمپلکس یا نقاط داخلی در این مقیاس شکست می‌خورند، زیرا تجزیه ماتریس‌ها (Matrix Factorization) در آن‌ها بیش از حد هزینه‌بر است.

به نقل از مطالعه موردی PyTorch، لینکدین برای عبور از این بن‌بست، ابزاری به نام DuaLip-PyTorch توسعه داد که جایگزین پشته قدیمی Scala/Spark شد. این سیستم به جای تجزیه‌های گران‌قیمت، از روش‌های مرتبه اول نخست-دوگان (First-order Primal-Dual methods) استفاده می‌کند که بر پایه اطلاعات گرادینت و ضرب ماتریس-بردار عمل می‌کنند.

جزئیات فنی این پیاده‌سازی عبارتند از:

  • استفاده از عملیات تنسورهای پراکنده (Sparse Tensors) برای مدیریت میلیاردها تا تریلیون‌ها متغیر.
  • استفاده از کرنل‌های تصویرسازی دسته‌ای (Batched Projection Kernels) و همگام‌سازی توزیع‌شده از طریق الگوهای all-reduce و broadcast.
  • بهره‌گیری از شتاب‌دهنده‌های همگرایی شامل گونه‌های AGD و FISTA.

چگونه لینکدین با پای‌تورچ مسائل بهینه‌سازی در مقیاس عظیم را حل می‌کند

نمودار بهینه‌سازی در مقیاس عظیم لینکدین با پای‌تورچ

حل مسائل بهینه‌سازی در مقیاس عظیم لینکدین با پای‌تورچ

این تغییر معماری منجر به افزایش ۷۵ برابری سرعت اجرای هر تکرار (Iteration) در مقایسه با پیاده‌سازی‌های مبتنی بر CPU شد.

چگونه لینکدین با پای‌تورچ مسائل بهینه‌سازی در مقیاس عظیم را حل می‌کند

از دیدگاه مهندسی، این گذار فرضیه قدیمی مبنی بر «صرفاً یادگیری عمیق بودن» PyTorch را می‌شکند. لینکدین با مدل‌سازی ساختاری یک حل‌کننده بهینه‌سازی به‌صورت یک شبکه عصبی — با استفاده از انتزاع‌های تنسوری و کرنل‌های GPU — شکاف بین یادگیری ماشین و بهینه‌سازی کلاسیک را پر کرده است. این امر هزینه استقرار محدودیت‌های پیچیده جدید در محیط عملیاتی را به‌شدت کاهش می‌دهد.

گام بعدی شما

  • بررسی جزئیات فنی کامل در گزارش DuaLip-GPU در وب‌سایت arXiv.
  • تحلیل پیاده‌سازی متن‌باز این سیستم در مخازن GitHub.
  • ارزیابی جایگزینی روش‌های تجزیه ماتریس با روش‌های مرتبه اول در سیستم‌های بهینه‌سازی داخلی خود.

اما این تنها بخشی از تحول در زیرساخت‌های پردازشی است؛ تحلیل ما درباره‌ی اثر این تغییر بر هزینه عملیاتی مراکز داده را دنبال کنید.

چرا این موضوع مهم است؟

این دستاورد با تکیه بر تجربه عملی در مقیاس تریلیونی، اعتبار استفاده از فریم‌ورک‌های یادگیری عمیق را برای محاسبات علمی گسترش می‌دهد. این تغییر باعث می‌شود شرکت‌ها بتوانند مسائل بهینه‌سازی عظیم را بدون نیاز به سخت‌افزارهای تخصصی و گران‌قیمت، روی همان GPUهای استاندارد اجرا کنند.

تأثیر برای ایران

این تحول بیشتر برای مهندسان سیستم و پژوهشگران محاسباتی اهمیت دارد؛ استفاده از PyTorch برای حل مسائل بهینه‌سازی غیر از یادگیری عمیق، مسیری است که توسعه‌دهندگان ایرانی می‌توانند برای بهینه‌سازی زیرساخت‌های داخلی دنبال کنند.

·نگاه ما
تحریریه دات‌هوش

تحلیل ما نشان می‌دهد که پیروزی واقعی لینکدین نه در عدد ۷۵، بلکه در «یکپارچه‌سازی پشته مهندسی» است. با تبدیل مسائل بهینه‌سازی کلاسیک به عملیات تنسوری، آن‌ها اصطکاک فنی بین تیم‌های ML و تیم‌های عملیاتی را از بین بردند و ثابت کردند که GPUها می‌توانند به عنوان موتورهای محاسباتی عمومی برای هر مسئله‌ای که ساختار ماتریسی دارد، عمل کنند؛ نه فقط برای مدل‌های زاینده.

منابع

گفتگو

شماره ۰۵۳پنج‌شنبه‌های هوش‌محور

بسته‌ی هفتگی دات‌هوش

۵ خبر، ۲ ابزار، ۱ پرامپت — به‌علاوه ۳ بخش جدید. بدون هیاهو، هر پنج‌شنبه صبح.

خبر کلیدی
ابزار کاربردی
پرامپت حرفه‌ای
تحلیل پژوهش
به‌زودی
زاویه‌ی ایرانی
به‌زودی
تمرین این هفته
به‌زودی
۰۰:۰۰تا شماره بعدیهفته‌ی ۵۳ بدون وقفه