بیشتر عاملهای یادگیری تقویتی در مواجهه با یک جادهبسته یا مانعی که در دادههای آموزشیشان نبوده، بهطور کامل قفل میکنند و دستورات بیمعنی صادر میکنند. برای حل این نقطه شکست مرگبار، سیستمی بر پایه برنامهریزی تطبیقی عصبی-نمادین توسعه یافته است که طبق گزارشهای فنی، زمان تخلیه در دادههای واقعی آتشسوزیهای ۲۰۲۰ را ۳۴٪ کاهش داده است.
مدیریت لجستیک در آتشسوزیهای جنگلی چالش عجیبی است؛ چون هم به قدرت تشخیص الگو نیاز دارد و هم به منطق سختگیرانه برای رعایت ایمنی. تخلیه شهرها در واقع یک مسئله بهینهسازی تحت شرایط عدم قطعیت است. در اینجا ما با دو نوع محدودیت روبرو هستیم: محدودیتهای منطقی (مثلاً «اگر جاده X بسته است، ماشین نباید وارد شود») و محدودیتهای احتمالی (مثلاً «۷۰٪ احتمال دارد آتش تا ۲ ساعت دیگر به منطقه Z برسد»). اکثر مدلهای فعلی فقط یکی را انتخاب میکنند: یادگیری عمیق مقیاسپذیر است اما مانند یک «جعبه سیاه» عمل میکند و دلیل تصمیماتش را نمیگوید، در حالی که استدلال نمادین تفسیرپذیر است اما نمیتواند با تغییرات لحظهای دادهها سازگار شود.
همانطور که در تحلیل قبلی ما دربارهی امنیت مدلهای بازمتن به مفهوم کنترلپذیری اشاره کردیم، این سیستم جدید با ایجاد یک لایه منطق مشتقپذیر، پلی میان این دو دنیا ساخته است. بر اساس گزارش فنی منتشر شده در ۲۹ ژوئن ۲۰۲۶، این معماری اجازه میدهد گرادیانها بین سیستم عصبی و نمادین جاری شوند تا مدل هم یاد بگیرد و هم منطقی باقی بماند.
شبکه عصبی (Neural Network) — شبیه نقشهٔ مترویی است که سیگنالها را از ورودی به جواب میرساند — در این سیستم در چهار ماژول مجزا سازماندهی شده است:
- رمزگذار وضعیت جهان (عصبی): یک مدل Conv-LSTM که تصاویر ماهوارهای را برای ردیابی جبهه آتش و تراکم ترافیک تحلیل میکند و یک وضعیت احتمالی از جهان میسازد. این رویکرد برای پایداری مدل در محیطهای پویا حیاتی است، مشابه آنچه در توقف فروپاشی مدلهای جهان با مکانیسم زیرهدفهای سلسلهمراتیک مشاهده کردیم.
- تولیدکننده محدودیت (نمادین): موتور نمادینی که از برنامهنویسی مجموعه پاسخ (ASP) برای کدگذاری قوانین سخت، مثل ظرفیت جادهها و مناطق ایمنی استفاده میکند.
- برنامهریز عصبی-نمادین: واحد مرکزی که پیشبینیهای عصبی را با فیلترهای نمادین ترکیب میکند تا مسیرهای معتبر بسازد. این بخش از تکنیک Gumbel-Softmax برای آموزش پایان-به-پایان استفاده میکند.
- تأییدکننده اعتماد صفر: ماژول سبکی که تصمیمات را بدون نیاز به اجرای کل مدل اعتبارسازی میکند تا هیچ نقطه شکست واحدی باعث فاجعه نشود.

به نقل از مستندات فنی این پروژه، برای پیوند دادن این دو بخش، ابتدا تصاویر ماهوارهای توسط یک LSTM رمزگذاری شده و سپس به یک لایه سافت-مکس (Softmax) میروند تا توزیع احتمالی مسیرهای تخلیه تولید شود. این مسیرها وارد تابع _symbolic_filter میشوند. در داخل این فیلتر، وضعیت شبکه جادهها به حقایق ASP تبدیل شده و کتابخانه clingo مسیرهای معتبر را استخراج میکند. برای اینکه کل این زنجیره قابل آموزش باشد، سیستم از ترفند Gumbel-Softmax استفاده میکند تا ماسک مسیرهای معتبر را در ضرب نهایی اعمال کرده و گرادیان را محاسبه کند.
در عملیاتی که جان انسانها در خطر است، اعتماد به یک مرجع مرکزی هوش مصنوعی یک ریسک سیستمی است. برای حل این مشکل، حاکمیت «اعتماد صفر» (Zero-Trust) پیاده شده است؛ یعنی هر مسیر تخلیه باید همراه با یک گواه cryptographic باشد که ثابت کند تمام محدودیتهای ایمنی و انصاف رعایت شده است.
بر اساس بررسی منابع متعدد، توسعهدهندگان به دلیل کند بودن پروتکلهای zk-SNARKs، از اثباتهای اوراکل تعاملی (IOPs) استفاده کردند. در این روش، از درختهای مرکل (Merkle trees) برای تعهدات استفاده میشود. تأییدکننده تنها زیرمجموعه تصادفی از محدودیتها را چک میکند و بدین ترتیب با کمترین تأخیر، تضمینهای آماری ایمنی را فراهم میکند. این یعنی هر سازمان مستقل میتواند بدون اجرای مجدد کل مدل، برنامه را تأیید کند.
فرآیند تولید گواه شامل ایجاد یک تعهد مرکل از برنامه و شاهد راه حل است. تأییدکننده یک چالش تصادفی بر اساس پارامتر امنیتی (معمولاً ۱۲۸ بیت) میسازد و اثباتکننده شاخههای خاصی از درخت مرکل را باز میکند. اگر تمام شاخهها با محدودیتها سازگار باشند، برنامه پذیرفته میشود.
گذار از تئوری به عمل با سه مانع مهندسی بزرگ همراه بود:
۱. مشکل گرادیان نمادین: از آنجا که حلکنندههای ASP خروجیهای گسسته دارند و گرادیان ندارند، توسعهدهندگان از «شمارش مدلهای وزندار» با تقریب نرم استفاده کردند. آنها محدودیتها را به فرم CNF وزندار تبدیل کرده و با پارامتری برای کنترل نرمی (Temperature)، امتیاز رضایت را از طریق torch.exp(log_z / temperature) محاسبه کردند. این کار باعث شد فیلتر نمادین مشتقپذیر شود.
۲. تأخیر در تأیید: نسخههای اولیه ۲ تا ۳ ثانیه تأخیر داشتند که برای تخلیه لحظهای مرگبار است. برای حل این موضوع، سیستم اکنون از کش اثبات (Proof Cache) برای زیر-برنامههای تکراری، دستهبندی (Batching) برای پردازش همزمان چندین گام و تأیید استهلاکی استفاده میکند تا بار محاسباتی کاهش یابد. این تلاش برای بهینهسازی زمان پاسخ، یادآور رویکردهای معماری SFRL در کاهش پهنای باند بهینهسازی مسیرهای فرار است.
۳. استواری در برابر حملات: رمزگذارهای عصبی را میتوان با تغییرات کوچک در تصاویر ماهوارهای فریب داد. تیم پروژه از آموزش خصمانه تأییدشده با استفاده از «انتشار کران بازهای» استفاده کرد. آنها با محاسبه کرانهای بالا و پایین برای تصاویر (با اپسیلون ۰.۰۱)، تضمین کردند که پیشبینیهای مدل حتی در بدترین حالت یا هنگام حملات تخریبی، پایدار بماند.
فراتر از سرعت، این سیستم بر «انصاف» در توزیع منابع تأکید دارد. لایه نمادین صراحتاً معیارهای انصاف را کدگذاری میکند تا هیچ منطقهای بیشتر از دو برابر میانگین زمان انتظار، منتظر کمکها نماند. این منطق به صورت :- zone(Z), wait_time(Z, T), avg_wait_time(AvgT), T > 2 * AvgT تعریف شده است.
علاوه بر این، محدودیتهای انصاف تضمین میکنند که تخصیص منابع بر اساس جمعیت باشد. برخلاف نقشههای ایستا، این پهنهبندی تطبیقی با تغییر باد منبسط یا منقبض میشود. برنامهریز عصبی-نمادین میتواند:
- با تغییر ناگهانی باد، مناطق را گسترش دهد تا مردم جلوتر از جبهه آتش باشند.
- جمعیتهای آسیبپذیر (سالمندان و معلولان) را با استفاده از محدودیتهای کدشده در لایه نمادین اولویتبندی کند.
- در لحظهای که جادهای غیرقابل عبور میشود، ترافیک را تغییر مسیر دهد تا از «قفل شدن» عاملها جلوگیری کند.
این قابلیت پویا به سیستم اجازه داد تا در دادههای آتشسوزی August Complex سال ۲۰۲۰، تضمینهای ایمنی را حفظ کند. در نگاه به آینده، توسعهدهندگان اشاره میکنند که تخلیه کلانشهری برای حلکنندههای کلاسیک همچنان یک مسئله NP-hard است. در حال حاضر آزمایشهایی با استفاده از الگوریتمهای بهینهسازی تقریبی کوانتومی (QAOA) از طریق Qiskit در حال انجام است تا این مسائل عظیم مدیریت شوند.
رویکرد کوانتومی شامل رمزگذاری محدودیتها به عنوان یک هامیلتونی ایسینگ و ساخت مدار QAOA با ۳ لایه p است. همچنین پروژه به سمت حاکمیت فدرال حرکت میکند؛ جایی که سازمانهای مختلف (آتشنشانی، حملونقل و بیمهها) هر کدام بخشی از محدودیتها را تأیید میکنند. این مدل امنیت جمعی را بدون ریسکهای متمرکزسازی فراهم میکند.
برای متخصصان زیرساختهای حیاتی، این تحول نشان میدهد که هوش مصنوعی «خالص» برای سیستمهای حساس به زندگی کافی نیست. آینده لجستیک اضطراری در معمارههایی است که در آن شبکه عصبی پیشنهاد میدهد و منطق نمادین تصمیم میگیرد، و همه اینها توسط یک لایه اثبات غیرمتمرکز تأیید میشود. این رویکرد ساختاریافته به مدیریت حوادث شباهت دارد، همانطور که در مسیر خودکار پاسخ به حوادث از طریق Multi-Agent Orchestration بررسی شد.
گام بعدی شما
- اگر در حوزه سیستمهای حساس (Critical Systems) فعالیت میکنید، معماریهای ترکیبی (Neuro-Symbolic) را جایگزین مدلهای End-to-End خالص کنید.
- برای کاهش تأخیر در سیستمهای تأییدی، الگوی Cache-and-Batch را در لایههای Verification بررسی کنید.
- مطالعه روی کتابخانه
clingoبرای تبدیل قوانین بیزینسی به محدودیتهای سخت در مدلهای هوش مصنوعی را آغاز کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو