گلوگاه اصلی در پیشآموزش مدلهای زبانی بزرگ (LLM) توزیعشده، نه لزوماً تعداد پردازندهها، بلکه زمان انتظار سریعترین گرهها برای کندترین آنهاست. اگر هنوز از روشهای همگامسازی سختگیرانه برای آموزش مدلهای توزیعشده استفاده میکنید، باید بدانید که این «مشکل عقبماندگان» (Straggler problem) میتواند بهرهوری کل سیستم را به شدت کاهش دهد.
گذار از روشهای همکاه کلی (All-Reduce) همگام به ارتباطات شایعهای (Gossip Communication) غیرمتمرکز، راهکاری برای حذف این محدودیت است. همانطور که در تحلیلهای پیشین ما دربارهی رانش مسیرهای آموزشی در مدلهای توزیعشده اشاره کردیم، صنعت اکنون به سمتی حرکت میکند که پیشرفت هر گره محاسباتی را از همگامسازی صلب جهانی جدا کند.
بر اساس مستندات مقالهای که در ۱۰ ژوئن ۲۰۲۶ منتشر شد، چارچوب GASLoC امکان آموزش مدل را در خوشههای ناهمگن (Heterogeneous Clusters) فراهم میکند بدون آنکه کیفیت همگرایی (Convergence) مدل آسیب ببیند. طبق گزارش arxiv.org، این سیستم با شتاببخشی به «بهینهساز بیرونی»، سه ارتقای فنی کلیدی را پیادهسازی کرده است:
- سازگاری کامل با بهینهسازهای تطبیقی (Adaptive Optimizers)
- پشتیبانی از گامهای بهینهساز محلی برای کاهش دفعات ارتباطی بین گرهها
- ادغام ارتباطات تصادفی و پراکنده (Sparse Randomized) میان همتایان
از نظر تجربی، GASLoC در تنظیمات ارتباطی تکگام، از الگوریتمهای غیرمتمرکز پیشرو پیشی گرفته است. در محیطهایی با پهنای باند ناهمگن، این مدل برتری چشمگیری نسبت به DiLoCo نشان داد، در حالی که در تنظیمات استاندارد چندگامه-محلی، رقابتی برابر با آن حفظ کرد.
این چرخش راهبردی به معنای پذیرش نوعی سازگاری نهایی (Eventual Consistency) در وزنهای مدل است. برای جامعهی پژوهشی، این دستاورد به معنای حذف پیشنیاز سختافزاری برای سرعتهای یکسانِ گرههاست و موانع آموزشهای همکاریمحور در محیطهای ابری پراکنده را از بین میبرد.
گام بعدی شما
- بررسی اثر GASLoC بر مدلهای با تریلیون پارامتر برای سنجش مقیاسپذیری واقعی
- رصد ادغام این چارچوب در کتابخانههای توزیعشدهای مانند FSDP متعلق به PyTorch
- ارزیابی کاهش هزینههای زیرساختی در صورت جایگزینی خوشههای همسان با سختافزارهای موجود
اما داستان سختافزاری این تحول در لایهی تراشهها پیچیدهتر است — به تحلیل ما دربارهی معماریهای جدید توزیع محاسبات مراجعه کنید.



گفتگو