تصور کنید در یک مزرعه دورافتاده هستید و حسگرهای شما باید بدون دسترسی به اینترنت پرسرعت، تصمیم بگیرند چه زمانی آبیاری کنند. اگر هنوز از روشهای متمرکز برای جمعآوری دادههای حسگر استفاده میکنید، احتمالاً با تخلیه سریع باتری و قطع مداوم ارتباطات دستوپنجره میجنگید.
بر اساس مستندات این پروژه، یک نمونه اولیه از کنترلکننده آبیاری خودکار با استفاده از یادگیری بازنمایی فدرال پراکنده (Sparse Federated Representation Learning) توانسته است ارسال دادهها را در مقایسه با مدلهای متراکم، ۹۲٪ کاهش دهد. این سیستم که به عنوان بخشی از یک پروژه تحقیقاتی شخصی از سال ۲۰۲۳ استقرار یافته است، به گرههای اینترنت اشی (IoT) با منابع محدود اجازه میدهد تا بدون ارسال دادههای خام به ابر، روی مدیریت انرژی و آب همکاری کنند. پژوهشگر این مسیر را با عیبیابی یک خطلوله یادگیری فدرال روی یک رزبری پای زیرو (Raspberry Pi Zero) آغاز کرد، در حالی که توسط پانلهای خورشیدی و حسگرهای رطوبت خاک در یک آزمایشگاه خانگی Makeshift محاصره شده بود.
بسیاری از استقرارهای کشاورزی هوشمند با «گلوگاه ارتباطی» میجنگند. یادگیری فدرال (FL) سنتی به پهنای باند بالا و اتصالات پایدار نیاز دارد، که در مزارع دورافتاده متکی به پروتکل LoRaWAN عملاً وجود ندارند. پژوهشگر متوجه شد که ارسال حتی یک بهروزرسانی وزن مدل با حجم متواضع ۱ مگابایت از طریق این شبکههای کمتوان، میتواند چندین دقیقه زمان ببرد و ذخایر حیاتی باتری را تخلیه کند، که اغلب منجر به Time-out یا قطع شدن سیستم میشود. این چالشها مشابه موانعی است که در پروژههای پیشین مشاهده شد، جایی که استفاده از یادگیری فعال حریمخصوصتمحور توانست مصرف دادهها در سیستمهای IoT را تا ۹۰٪ کاهش دهد.
همانطور که در تحلیل قبلی ما دربارهی رایانش لبه (Edge Computing) اشاره کردیم، کلید حل این مشکل در کاهش حجم پردازشی است. این پروژه با ترکیب شبکههای عصبی پراکنده و یادگیری بازنمایی، شکاف موجود را پر میکند. بهجای بهروزرسانی تکتک پارامترها، سیستم بهروزرسانیها را به زیرمجموعه کوچکی از وزنها محدود میکند. این رویکرد از «فرضیه بلیط بخت» (Lottery Ticket Hypothesis) سود میبرد؛ ایدهای که میگوید شبکههای متراکم حاوی زیرشبکههای پراکندهای هستند که اگر به درستی آموزش ببینند، قادرند عملکرد کل شبکه را بازتولید کنند. این ترکیب اجازه میدهد استخراج ویژگیهای قدرتمندی صورت گیرد در حالی که سیستم از نظر ارتباطی بهینه باقی میماند. این متدولوژی یادگیری فدرال پراکنده (SFRL) پیش از این در سناریوهای بحرانی دیگر نیز به کار رفته است، از جمله در بهینهسازی مسیرهای فرار در آتشسوزیهای جنگلی که منجر به کاهش ۸۵ درصدی پهنای باند مورد نیاز شد.
چالش مدیریت ریزشبکه
در کشاورزی هوشمند، مدیریت تنها جمعآوری داده نیست، بلکه کنترل پیچیده پیوند انرژی-آب (Energy-Water Nexus) است. این سیستم باید سه چالش اصلی را مدیریت کند:
- توازن انرژی: نیاز به توزیع موثر برق خورشیدی بین پمپهای آبیاری، حسگرها و سیستمهای ذخیرهسازی باتری.
- کنترل پیشبینانه: پیشبینی نیازهای آبیاری از طریق تحلیل رطوبت خاک، پیشبینیهای هواشناسی و مدلهای رشد خاص هر محصول.
- تحمل خطا: اطمینان از اینکه سیستم در صورت شکست حسگرها یا افت ناگهانی اتصال، بدون کرش کردن کنترلکننده جهانی، به طور منعطف واکنش نشان دهد.
رویکردهای متمرکز سنتی نیازمند اتصال دائمی به ابر هستند که برای مزارع دورافتاده غیرعملی است. این معماری ترکیبی اجازه میدهد هر گنه IoT یک مدل بازنمایی پراکنده محلی اجرا کند که دادههای حسگر را به بردارهای معنایی یا امبدینگهای فشرده (Compact Embeddings) تبدیل میکند. سپس یک تجمیعکننده مرکزی این بردارها را ترکیب کرده تا کنترلکننده جهانی را بهروز کند.
معماری فنی
این سیستم از یک خودرمزگذار حسگر پراکنده (Sparse Sensor Autoencoder) برای پردازش دادههای سری زمانی چندمتغیره، شامل رطوبت خاک، تابش خورشیدی، دما و رطوبت استفاده میکند. هسته این سامانه کلاس SparseSensorAutoencoder است که از ساختار رمزگذار (Encoder) و رمزگشا (Decoder) برای یادگیری بازنماییهای نهان فشرده از دادههای محیطی بهره میبرد. رمزگذار یک بعد ورودی (مثلاً ۱۰) را گرفته و آن را به یک بعد نهان (مثلاً ۴) فشرده میکند.
برای حفظ کارایی، سازوکارهای کلیدی زیر در معماری به کار گرفته شدهاند:
- هرس کردن L1 غیرساختارمند: با استفاده از متد
torch.nn.utils.prune.l1_unstructuredحدود ۸۰٪ از وزنها در حین آموزش حذف میشوند. این کار تضمین میکند که مدل برای اجرا روی تراشههای ARM به اندازه کافی سبک بماند. - بردارهای معنایی فشرده: دادههای حسگر به یک بردار نهان ۴ بعدی تبدیل میشوند. این کار باعث میشود مشکل ارتباط (ارسال وزنها) از مشکل پیشبینی (تفسیر محیط) کاملاً تفکیک شود.
- تجمیع پراکنده: با استفاده از
SparseFederatedAggregatorگرهها تنها شاخصها (Indices) و مقادیر وزنهای غیرصفر را ارسال میکنند. سرور این مقادیر را با استفاده از میانگین وزنی تجمیع کرده و وزنهای هرسشده را مجدداً توزیع میکند.
جهت اطمینان از اینکه مدل جهانی پراکنده باقی میماند، کلاس SparseFederatedAggregator شامل مکانیسم prune_frequency است (که به طور پیشفرض روی هر ۵ دور تنظیم شده است) تا هرس را دوباره اعمال کرده و سطح پراکندگی مطلوب ۰.۸ را حفظ کند.

استقرار روی سختافزارهای کمتوان
برای اینکه سیستم روی میکروکنترلرهایی در کلاس ESP32 و دستگاههای رزبری پای زیرو قابل اجرا باشد، پیادهسازی بر روی حفاظت شدید از انرژی و مدیریت حافظه تمرکز دارد.
جزئیات پیادهسازی برای گرههای لبه:
- کوانتایزیشن عدد صحیح: توسعهدهنده از
torch.quantization.quantize_dynamicاستفاده کرد تا مدل را برای افزایش کارایی استنتاج به فرمتint8تبدیل کند. استنتاج همان لحظهای است که مدل واقعاً جواب تولید میکند، شبیه به عمل آشپزی در مقابل دوره آموزش آن. - محدودیتهای آموزش: برای صرفهجویی در مصرف برق، کلاس
LowPowerClientآموزش را به ۱ یا ۲ دور (Epoch) در هر مرحله محدود کرده و در هر دور تنها یک دسته داده (Batch) را پردازش میکند. - بهینهسازی حافظه: با استفاده از
torch.optim.SGDو تابع هزینهnn.MSELossسیستم کمترین ردپای محاسباتی ممکن را روی دستگاه حفظ میکند. - استخراج وزن: متد
get_sparse_weightsبرای استخراج تنها وزنهای غیرصفر به کار میرود و یک دیکشنری از شاخصها و مقادیر برای ارسال ایجاد میکند.
در یک تست دنیای واقعی روی یک زمین ۲ هکتاری، ۵ گره حسگر با یک رزبری پای به عنوان تجمیعکننده همکاری کردند. طبق دادههای پروژه، این پیکربندی اجازه داد گرهها با یک تک باتری ۱۸۶۵۰ به مدت ۳.۲ ماه فعال بمانند؛ این یک جهش عظیم نسبت به عمر ۲ هفتهای است که در یادگیری فدرال استاندارد مشاهده میشد. این سیستم به امتیاز F1 معادل ۸۷٪ برای پیشبینی نیاز آبیاری رسید که تنها ۵٪ با عملکرد یک رویکرد متمرکز کامل فاصله داشت.
حل پارادوکس هرس کردن
هرس تهاجمی اغلب منجر به «محوشدن گرادیان» (Vanishing Gradient) میشود؛ وضعیتی که در آن وزنهای هرسشده نمیتوانند دوباره بازیابی شوند. در آزمایشات اولیه، پژوهشگر دریافت که سطوح پراکندگی بالای ۹۰٪ مانع از بازیابی اتصالات مهم شده و همگرایی مدل را متوقف میکند.
برای حل این مشکل، سیستم یک برنامه «هرس چرخهای» (cyclical pruning) را پیاده میکند. هر ۱۰ دور، ماسکهای هرس از طریق prune.remove بازنشانی شده و مدل متد prune.random_unstructured را با درجه کمی از تصادفی بودن اعمال میکند. این کار به مدل اجازه میدهد اتصالات مهم را دوباره «کشف» کند و با بازگرداندن دورهای ماسکها، قدرت بیان خود را در طول زمان حفظ نماید.
مدیریت تنوع محیطی
دادههای کشاورزی به شدت Non-IID (غیر مستقل و دارای توزیع غیریکسان) هستند. برای مثال، رطوبت خاک بین یک تکه زمین آفتابی و یک منطقه سایهدار به شدت تفاوت دارد و توزیعهای دادهای متفاوتی در گرهها ایجاد میکند.
تجمیعهای استاندارد FL مانند FedAvg عملکرد ضعیفی داشتند و باعث واگرایی مدل شدند. تیم پژوهشی رویکرد «یادگیری فدرال خوشهای» (Clustered FL) را پیاده کرد که در آن گرهها بر اساس مناطق ریزاقلیمی (Microclimate Zones) گروهبندی میشوند. بازنماییهای پراکنده ابتدا در داخل این خوشهها تجمیع شده و سپس یک ادغام جهانی انجام میشود تا تضمین گردد مدل روی یک ریزاقلیم خاص بیشبرازش نشود.
پذیرش سختافزارهای ناهمگون
چالش دیگری از تفاوت قابلیتهای کلاینتها ناشی شد؛ زیرا برخی گرهها از تراشههای ESP8266 و برخی دیگر از ESP32های قدرتمندتر استفاده میکردند. اندازه یکنواخت مدلها در ابتدا باعث ایجاد Time-out در گرههای ضعیفتر میشد.
راهکار این مشکل، پیادهسازی «سطوح پراکندگی تطبیقی» بود. گرههایی با حافظه کمتر میتوانستند پراکندگی بیشتری (مثلاً ۹۵٪ در برابر ۸۰٪) درخواست کنند. سرور سپس از یک رویکرد یادگیری متا (Meta-learning) برای درونیابی بین این بازنماییهای پراکنده مختلف استفاده کرد تا علیرغم تفاوتهای سختافزاری، یک مدل جهانی منسجم حاصل شود.
از داده تا عمل: کنترلکننده ریزشبکه
امبدینگهای ۴ بعدی حاصل به یک عامل یادگیری تقویتی تزریق میشوند که توسط کلاس MicrogridController مدیریت میشود. این عامل میانگین امبدینگهای نهان را گرفته و آنها را با سه متغیر اضافی ترکیب میکند: سطح باتری، زمان روز و پیشبینیهای هواشناسی.
عامل از طریق یک شبکه سیاست (policy_net) که یک شبکه عصبی با خروجی Softmax است، سه اقدام اصلی را بهینه میکند:
۱. اولویتبندی پمپهای آبیاری در ساعات اوج تابش خورشیدی برای به حداکثر رساندن بهرهوری انرژی.
۲. شارژ ذخایر باتری با انرژی اضافی زمانی که تابش خورشیدی بالا است.
۳. قرار دادن حسگرها در حالت خواب در دورههای کمفعالیت برای افزایش طول عمر سختافزار.
نتیجه عملیاتی، یک سیستم خودکار است که ۴۷ روز بدون دخالت انسان کار کرده و به نرخ دقت ۹۱٪ در پیشبینی نیازهای آبیاری دست یافته است، در حالی که شارژ بهینه باتری را طی دو موج گرمایی حفظ کرده است.
آینده هوش مصنوعی پراکنده در لبه
این تغییر رویکرد ثابت میکند که پراکندگی یک قابلیت است، نه یک محدودیت. با هرس تهاجمی مدلها، توسعهدهندگان میتوانند در واقع تعمیمپذیری را بهبود بخشیده و از بیشبرازش (Overfitting) — وقتی مدل بیش از حد به نویزهای محلی حساس میشود و نمیتواند روی دادههای جدید درست عمل کند — جلوگیری کنند.
با نگاه به آینده، سه مسیر پژوهشی کلیدی در حال ظهور است:
- بازنماییهای تقویتشده کوانتومی: آزمایش با شبکههای تانسوری الهامگرفته از کوانتوم (مانند حالتهای ضرب ماتریسی) و تجزیه قطار تانسوری برای نمایش وزنهای مدل پراکنده، که پتانسیل کاهش ارتباطات را تا یک مرتبه دیگر دارد.
- پیشآموزش خودنظارتی: استفاده از یادگیری مقابلهای (Contrastive Learning) روی دادههای مصنوعی کشاورزی تا گرههای جدید بتوانند با انطباق Zero-shot استقرار یابند و تنها به چند دور تنظیم دقیق پراکنده نیاز داشته باشند.
- هماهنگی لبهبهلبه: حرکت به سمت شبکههای مش (Mesh) کاملاً غیرمتمرکز با استفاده از پروتکلهای Gossip و تجمیع مقاوم در برابر حملات بیزانسی، تا تجمیعکننده مرکزی در مزارعی که هیچ دسترسی به اینترنت ندارند، کاملاً حذف شود.
برای متخصصان، این یعنی هزینه ورود به سختافزارهای «هوشمند» در حال کاهش است. یادگیری ماشین معنادار اکنون روی دستگاههای کمتر از ۱۰ دلاری ممکن است، به شرطی که معماری نرمافزار، ارتباطات پراکنده را بر تراکم خام مدل ترجیح دهد.
شما میتوانید جزئیات پیادهسازی و منطق معماری را در مخزن sparse-agri-mg در گیتهاب بیشتر بررسی کنید تا این تکنیکهای هرس را در استک IoT خود به کار ببرید. نکته کلیدی این است که یادگیری بازنمایی به عنوان یک پل عمل میکند و مشکل ارتباط را از مشکل پیشبینی تفکیک میکند.
گام بعدی شما
- اگر روی سختافزارهای محدود کار میکنید، تکنیک هرس L1 را برای کاهش اثر-حافظه (Memory Footprint) مدلهای خود امتحان کنید.
- برای کاهش هزینه انتقال داده در شبکههای LPWAN، بهجای ارسال وزنهای خام، از یادگیری بازنمایی برای ارسال بردارهای فشرده استفاده کنید.
- مخزن
sparse-agri-mgرا برای مشاهده نحوه پیادهسازیSparseFederatedAggregatorبررسی کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک چگونگی اجرای این مدلها روی تراشههای نسل جدید، به تحلیل ما درباره پردازندههای عصبی (NPU) مراجعه کنید.




گفتگو