یادگیری فدرال پراکنده مصرف داده‌های اینترنت اشی کشاورزی را ۹۲٪ کاهش داد

منبع خبر

۲ دقیقه پیش·۱۱ تیر ۱۴۰۵۸ دقیقه مطالعه

یادگیری بازنمایی فدراسیونی پراکنده برای هماهنگی ریزشبکه کشاورزی هوشمند در استقرارهای خودمختار کم‌توان

اشتراک‌گذاری

تصور کنید در یک مزرعه دورافتاده هستید و حسگرهای شما باید بدون دسترسی به اینترنت پرسرعت، تصمیم بگیرند چه زمانی آبیاری کنند. اگر هنوز از روش‌های متمرکز برای جمع‌آوری داده‌های حسگر استفاده می‌کنید، احتمالاً با تخلیه سریع باتری و قطع مداوم ارتباطات دست‌وپنجره می‌جنگید.

بر اساس مستندات این پروژه، یک نمونه اولیه از کنترل‌کننده آبیاری خودکار با استفاده از یادگیری بازنمایی فدرال پراکنده (Sparse Federated Representation Learning) توانسته است ارسال داده‌ها را در مقایسه با مدل‌های متراکم، ۹۲٪ کاهش دهد. این سیستم که به عنوان بخشی از یک پروژه تحقیقاتی شخصی از سال ۲۰۲۳ استقرار یافته است، به گره‌های اینترنت اشی (IoT) با منابع محدود اجازه می‌دهد تا بدون ارسال داده‌های خام به ابر، روی مدیریت انرژی و آب همکاری کنند. پژوهشگر این مسیر را با عیب‌یابی یک خط‌لوله یادگیری فدرال روی یک رزبری پای زیرو (Raspberry Pi Zero) آغاز کرد، در حالی که توسط پانل‌های خورشیدی و حسگرهای رطوبت خاک در یک آزمایشگاه خانگی Makeshift محاصره شده بود.

بسیاری از استقرار‌های کشاورزی هوشمند با «گلوگاه ارتباطی» می‌جنگند. یادگیری فدرال (FL) سنتی به پهنای باند بالا و اتصالات پایدار نیاز دارد، که در مزارع دورافتاده متکی به پروتکل LoRaWAN عملاً وجود ندارند. پژوهشگر متوجه شد که ارسال حتی یک به‌روزرسانی وزن مدل با حجم متواضع ۱ مگابایت از طریق این شبکه‌های کم‌توان، می‌تواند چندین دقیقه زمان ببرد و ذخایر حیاتی باتری را تخلیه کند، که اغلب منجر به Time-out یا قطع شدن سیستم می‌شود. این چالش‌ها مشابه موانعی است که در پروژه‌های پیشین مشاهده شد، جایی که استفاده از یادگیری فعال حریم‌خصوصت‌محور توانست مصرف داده‌ها در سیستم‌های IoT را تا ۹۰٪ کاهش دهد.

همان‌طور که در تحلیل قبلی ما درباره‌ی رایانش لبه (Edge Computing) اشاره کردیم، کلید حل این مشکل در کاهش حجم پردازشی است. این پروژه با ترکیب شبکه‌های عصبی پراکنده و یادگیری بازنمایی، شکاف موجود را پر می‌کند. به‌جای به‌روزرسانی تک‌تک پارامترها، سیستم به‌روزرسانی‌ها را به زیرمجموعه کوچکی از وزن‌ها محدود می‌کند. این رویکرد از «فرضیه بلیط بخت» (Lottery Ticket Hypothesis) سود می‌برد؛ ایده‌ای که می‌گوید شبکه‌های متراکم حاوی زیرشبکه‌های پراکنده‌ای هستند که اگر به درستی آموزش ببینند، قادرند عملکرد کل شبکه را بازتولید کنند. این ترکیب اجازه می‌دهد استخراج ویژگی‌های قدرتمندی صورت گیرد در حالی که سیستم از نظر ارتباطی بهینه باقی می‌ماند. این متدولوژی یادگیری فدرال پراکنده (SFRL) پیش از این در سناریوهای بحرانی دیگر نیز به کار رفته است، از جمله در بهینه‌سازی مسیرهای فرار در آتش‌سوزی‌های جنگلی که منجر به کاهش ۸۵ درصدی پهنای باند مورد نیاز شد.

چالش مدیریت ریزشبکه

در کشاورزی هوشمند، مدیریت تنها جمع‌آوری داده نیست، بلکه کنترل پیچیده پیوند انرژی-آب (Energy-Water Nexus) است. این سیستم باید سه چالش اصلی را مدیریت کند:

توازن انرژی: نیاز به توزیع موثر برق خورشیدی بین پمپ‌های آبیاری، حسگرها و سیستم‌های ذخیره‌سازی باتری.
کنترل پیش‌بینانه: پیش‌بینی نیازهای آبیاری از طریق تحلیل رطوبت خاک، پیش‌بینی‌های هواشناسی و مدل‌های رشد خاص هر محصول.
تحمل خطا: اطمینان از اینکه سیستم در صورت شکست حسگرها یا افت ناگهانی اتصال، بدون کرش کردن کنترل‌کننده جهانی، به طور منعطف واکنش نشان دهد.

رویکردهای متمرکز سنتی نیازمند اتصال دائمی به ابر هستند که برای مزارع دورافتاده غیرعملی است. این معماری ترکیبی اجازه می‌دهد هر گنه IoT یک مدل بازنمایی پراکنده محلی اجرا کند که داده‌های حسگر را به بردارهای معنایی یا امبدینگ‌های فشرده (Compact Embeddings) تبدیل می‌کند. سپس یک تجمیع‌کننده مرکزی این بردارها را ترکیب کرده تا کنترل‌کننده جهانی را به‌روز کند.

معماری فنی

این سیستم از یک خودرمزگذار حسگر پراکنده (Sparse Sensor Autoencoder) برای پردازش داده‌های سری زمانی چندمتغیره، شامل رطوبت خاک، تابش خورشیدی، دما و رطوبت استفاده می‌کند. هسته این سامانه کلاس SparseSensorAutoencoder است که از ساختار رمزگذار (Encoder) و رمزگشا (Decoder) برای یادگیری بازنمایی‌های نهان فشرده از داده‌های محیطی بهره می‌برد. رمزگذار یک بعد ورودی (مثلاً ۱۰) را گرفته و آن را به یک بعد نهان (مثلاً ۴) فشرده می‌کند.

برای حفظ کارایی، سازوکارهای کلیدی زیر در معماری به کار گرفته شده‌اند:

هرس کردن L1 غیرساختارمند: با استفاده از متد torch.nn.utils.prune.l1_unstructured حدود ۸۰٪ از وزن‌ها در حین آموزش حذف می‌شوند. این کار تضمین می‌کند که مدل برای اجرا روی تراشه‌های ARM به اندازه کافی سبک بماند.
بردارهای معنایی فشرده: داده‌های حسگر به یک بردار نهان ۴ بعدی تبدیل می‌شوند. این کار باعث می‌شود مشکل ارتباط (ارسال وزن‌ها) از مشکل پیش‌بینی (تفسیر محیط) کاملاً تفکیک شود.
تجمیع پراکنده: با استفاده از SparseFederatedAggregator گره‌ها تنها شاخص‌ها (Indices) و مقادیر وزن‌های غیرصفر را ارسال می‌کنند. سرور این مقادیر را با استفاده از میانگین وزنی تجمیع کرده و وزن‌های هرس‌شده را مجدداً توزیع می‌کند.

جهت اطمینان از اینکه مدل جهانی پراکنده باقی می‌ماند، کلاس SparseFederatedAggregator شامل مکانیسم prune_frequency است (که به طور پیش‌فرض روی هر ۵ دور تنظیم شده است) تا هرس را دوباره اعمال کرده و سطح پراکندگی مطلوب ۰.۸ را حفظ کند.

هماهنگی سرباز-به-ابر برای طراحی ایستگاه اکتشاف اعماق دریا در شرایط داده‌کم شدید

استقرار روی سخت‌افزارهای کم‌توان

برای اینکه سیستم روی میکروکنترلرهایی در کلاس ESP32 و دستگاه‌های رزبری پای زیرو قابل اجرا باشد، پیاده‌سازی بر روی حفاظت شدید از انرژی و مدیریت حافظه تمرکز دارد.

جزئیات پیاده‌سازی برای گره‌های لبه:

کوانتایزیشن عدد صحیح: توسعه‌دهنده از torch.quantization.quantize_dynamic استفاده کرد تا مدل را برای افزایش کارایی استنتاج به فرمت int8 تبدیل کند. استنتاج همان لحظه‌ای است که مدل واقعاً جواب تولید می‌کند، شبیه به عمل آشپزی در مقابل دوره آموزش آن.
محدودیت‌های آموزش: برای صرفه‌جویی در مصرف برق، کلاس LowPowerClient آموزش را به ۱ یا ۲ دور (Epoch) در هر مرحله محدود کرده و در هر دور تنها یک دسته داده (Batch) را پردازش می‌کند.
بهینه‌سازی حافظه: با استفاده از torch.optim.SGD و تابع هزینه nn.MSELoss سیستم کمترین ردپای محاسباتی ممکن را روی دستگاه حفظ می‌کند.
استخراج وزن: متد get_sparse_weights برای استخراج تنها وزن‌های غیرصفر به کار می‌رود و یک دیکشنری از شاخص‌ها و مقادیر برای ارسال ایجاد می‌کند.

در یک تست دنیای واقعی روی یک زمین ۲ هکتاری، ۵ گره حسگر با یک رزبری پای به عنوان تجمیع‌کننده همکاری کردند. طبق داده‌های پروژه، این پیکربندی اجازه داد گره‌ها با یک تک باتری ۱۸۶۵۰ به مدت ۳.۲ ماه فعال بمانند؛ این یک جهش عظیم نسبت به عمر ۲ هفته‌ای است که در یادگیری فدرال استاندارد مشاهده می‌شد. این سیستم به امتیاز F1 معادل ۸۷٪ برای پیش‌بینی نیاز آبیاری رسید که تنها ۵٪ با عملکرد یک رویکرد متمرکز کامل فاصله داشت.

حل پارادوکس هرس کردن

هرس تهاجمی اغلب منجر به «محوشدن گرادیان» (Vanishing Gradient) می‌شود؛ وضعیتی که در آن وزن‌های هرس‌شده نمی‌توانند دوباره بازیابی شوند. در آزمایشات اولیه، پژوهشگر دریافت که سطوح پراکندگی بالای ۹۰٪ مانع از بازیابی اتصالات مهم شده و همگرایی مدل را متوقف می‌کند.

برای حل این مشکل، سیستم یک برنامه «هرس چرخه‌ای» (cyclical pruning) را پیاده می‌کند. هر ۱۰ دور، ماسک‌های هرس از طریق prune.remove بازنشانی شده و مدل متد prune.random_unstructured را با درجه کمی از تصادفی بودن اعمال می‌کند. این کار به مدل اجازه می‌دهد اتصالات مهم را دوباره «کشف» کند و با بازگرداندن دوره‌ای ماسک‌ها، قدرت بیان خود را در طول زمان حفظ نماید.

مدیریت تنوع محیطی

داده‌های کشاورزی به شدت Non-IID (غیر مستقل و دارای توزیع غیریکسان) هستند. برای مثال، رطوبت خاک بین یک تکه زمین آفتابی و یک منطقه سایه‌دار به شدت تفاوت دارد و توزیع‌های داده‌ای متفاوتی در گره‌ها ایجاد می‌کند.

تجمیع‌های استاندارد FL مانند FedAvg عملکرد ضعیفی داشتند و باعث واگرایی مدل شدند. تیم پژوهشی رویکرد «یادگیری فدرال خوشه‌ای» (Clustered FL) را پیاده کرد که در آن گره‌ها بر اساس مناطق ریزاقلیمی (Microclimate Zones) گروه‌بندی می‌شوند. بازنمایی‌های پراکنده ابتدا در داخل این خوشه‌ها تجمیع شده و سپس یک ادغام جهانی انجام می‌شود تا تضمین گردد مدل روی یک ریزاقلیم خاص بیش‌برازش نشود.

پذیرش سخت‌افزارهای ناهمگون

چالش دیگری از تفاوت قابلیت‌های کلاینت‌ها ناشی شد؛ زیرا برخی گره‌ها از تراشه‌های ESP8266 و برخی دیگر از ESP32های قدرتمندتر استفاده می‌کردند. اندازه یکنواخت مدل‌ها در ابتدا باعث ایجاد Time-out در گره‌های ضعیف‌تر می‌شد.

راهکار این مشکل، پیاده‌سازی «سطوح پراکندگی تطبیقی» بود. گره‌هایی با حافظه کمتر می‌توانستند پراکندگی بیشتری (مثلاً ۹۵٪ در برابر ۸۰٪) درخواست کنند. سرور سپس از یک رویکرد یادگیری متا (Meta-learning) برای درون‌یابی بین این بازنمایی‌های پراکنده مختلف استفاده کرد تا علی‌رغم تفاوت‌های سخت‌افزاری، یک مدل جهانی منسجم حاصل شود.

از داده تا عمل: کنترل‌کننده ریزشبکه

امبدینگ‌های ۴ بعدی حاصل به یک عامل یادگیری تقویتی تزریق می‌شوند که توسط کلاس MicrogridController مدیریت می‌شود. این عامل میانگین امبدینگ‌های نهان را گرفته و آن‌ها را با سه متغیر اضافی ترکیب می‌کند: سطح باتری، زمان روز و پیش‌بینی‌های هواشناسی.

عامل از طریق یک شبکه سیاست (policy_net) که یک شبکه عصبی با خروجی Softmax است، سه اقدام اصلی را بهینه می‌کند:
۱. اولویت‌بندی پمپ‌های آبیاری در ساعات اوج تابش خورشیدی برای به حداکثر رساندن بهره‌وری انرژی.
۲. شارژ ذخایر باتری با انرژی اضافی زمانی که تابش خورشیدی بالا است.
۳. قرار دادن حسگرها در حالت خواب در دوره‌های کم‌فعالیت برای افزایش طول عمر سخت‌افزار.

نتیجه عملیاتی، یک سیستم خودکار است که ۴۷ روز بدون دخالت انسان کار کرده و به نرخ دقت ۹۱٪ در پیش‌بینی نیازهای آبیاری دست یافته است، در حالی که شارژ بهینه باتری را طی دو موج گرمایی حفظ کرده است.

آینده هوش مصنوعی پراکنده در لبه

این تغییر رویکرد ثابت می‌کند که پراکندگی یک قابلیت است، نه یک محدودیت. با هرس تهاجمی مدل‌ها، توسعه‌دهندگان می‌توانند در واقع تعمیم‌پذیری را بهبود بخشیده و از بیش‌برازش (Overfitting) — وقتی مدل بیش از حد به نویزهای محلی حساس می‌شود و نمی‌تواند روی داده‌های جدید درست عمل کند — جلوگیری کنند.

با نگاه به آینده، سه مسیر پژوهشی کلیدی در حال ظهور است:

بازنمایی‌های تقویت‌شده کوانتومی: آزمایش با شبکه‌های تانسوری الهام‌گرفته از کوانتوم (مانند حالت‌های ضرب ماتریسی) و تجزیه قطار تانسوری برای نمایش وزن‌های مدل پراکنده، که پتانسیل کاهش ارتباطات را تا یک مرتبه دیگر دارد.
پیش‌آموزش خودنظارتی: استفاده از یادگیری مقابله‌ای (Contrastive Learning) روی داده‌های مصنوعی کشاورزی تا گره‌های جدید بتوانند با انطباق Zero-shot استقرار یابند و تنها به چند دور تنظیم دقیق پراکنده نیاز داشته باشند.
هماهنگی لبه‌به‌لبه: حرکت به سمت شبکه‌های مش (Mesh) کاملاً غیرمتمرکز با استفاده از پروتکل‌های Gossip و تجمیع مقاوم در برابر حملات بیزانسی، تا تجمیع‌کننده مرکزی در مزارعی که هیچ دسترسی به اینترنت ندارند، کاملاً حذف شود.

برای متخصصان، این یعنی هزینه ورود به سخت‌افزارهای «هوشمند» در حال کاهش است. یادگیری ماشین معنادار اکنون روی دستگاه‌های کمتر از ۱۰ دلاری ممکن است، به شرطی که معماری نرم‌افزار، ارتباطات پراکنده را بر تراکم خام مدل ترجیح دهد.

شما می‌توانید جزئیات پیاده‌سازی و منطق معماری را در مخزن sparse-agri-mg در گیت‌هاب بیشتر بررسی کنید تا این تکنیک‌های هرس را در استک IoT خود به کار ببرید. نکته کلیدی این است که یادگیری بازنمایی به عنوان یک پل عمل می‌کند و مشکل ارتباط را از مشکل پیش‌بینی تفکیک می‌کند.

گام بعدی شما

اگر روی سخت‌افزارهای محدود کار می‌کنید، تکنیک هرس L1 را برای کاهش اثر-حافظه (Memory Footprint) مدل‌های خود امتحان کنید.
برای کاهش هزینه انتقال داده در شبکه‌های LPWAN، به‌جای ارسال وزن‌های خام، از یادگیری بازنمایی برای ارسال بردارهای فشرده استفاده کنید.
مخزن sparse-agri-mg را برای مشاهده نحوه پیاده‌سازی SparseFederatedAggregator بررسی کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ برای درک چگونگی اجرای این مدل‌ها روی تراشه‌های نسل جدید، به تحلیل ما درباره پردازنده‌های عصبی (NPU) مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.