تصور کنید یک متخصص امنیت باشید که باید شبکهای حساس را بررسی کند، اما اجازه ندارد حتی یک بایت داده را به سرورهای خارجی بفرستد. Halo با تبدیل این سختگیری به یک قابلیت، ریسک حریم خصوصی در هوش مصنوعیهای ابری را بهطور کامل حذف کرده است. این رویکرد یادآور استراتژیهای پیشرفتهای است که در معماری E.L.L.A برای توقف نشت دادهها به کار گرفته شده تا امنیت را از سطح اعتماد به سطح ساختاری برساند.
طبق گزارشی که در ۲۹ ژوئن ۲۰۲۶ در dev.to منتشر شد، این عامل (Agent) — که مانند یک مدیر پروژه هوشمند است و میداند هر مرحله از کار را با کدام ابزار پیش ببرد — تمام عملیات خود را روی سختافزار محلی اجرا میکند. ارسال دادههای حساس مشتری به APIهای خارجی در طول یک ممیزی امنیتی، عملاً هدف آن پروژه را زیر سؤال میبرد. Halo با بهرهگیری از مدل Gemma 4 که از طریق LM Studio میزبان شده است، تضمین میکند که هیچ دادهای از دستگاه خارج نشود و نیازی به پرداخت هزینه اشتراک نباشد.

همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کنترل کامل بر وزنهای مدل، کلید دستیابی به حریم خصوصی مطلق است. Halo بهعنوان یک هماهنگکنندهٔ آنی برای ۲۲ ابزار امنیتی مختلف عمل میکند. این قابلیت مدیریت ابزارهای متعدد، مشابه رویکردی است که اپلیکیشن Hermes در سادهسازی گردشکارهای چندعاملی به کار گرفته تا پیچیدگیهای عملیاتی را کاهش دهد. این عامل با تصمیمگیری درباره ابزار مناسب و تفسیر نتایج، مجموعهای شامل موارد زیر را مدیریت میکند:
- اسکن شبکه با استفاده از nmap و subfinder
- تشخیص نقاط ضعف وب با nikto و nuclei
- اکسپلویت و فازینگ از طریق sqlmap، hydra و gobuster

نکته جالب این پروژه، происхождение آن از طریق Vibe Coding (برنامهنویسی بر اساس حس و شهود) است؛ توسعهدهنده در حالی که معماری سیستم را میساخت، مفاهیم پایتون و امنیت سایبری را همزمان یاد گرفت. بر اساس مستندات پروژه، این رویکرد غیرمتعارف منجر به سیستمی شده است که تنها با یک کلمه «engage» عملیات کامل را آغاز کرده و گزارشهای سطحبندیشده از ریسکها تولید میکند.

برای متخصصان امنیت، این تغییر به معنای حرکت به سمت هوش مصنوعی حاکمیتی (Sovereign AI) است. با جدا کردن استدلالهای قدرتمند مدل زبانی بزرگ (LLM) — که مثل کتابخانهداری است که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — از فضای ابری، اکنون میتوان گردشهای کاری عاملمحور را در محیطهای کاملاً ایزوله (Air-gapped) بدون نقض تعهدات اخلاقی یا قانونی مستقر کرد.
گام بعدی شما
- مخزن باز در گیتهاب پروژه را برای بررسی معماری فعلی دنبال کنید.
- مدل Gemma 4 را از طریق LM Studio روی سیستم خود تست کنید تا سرعت استنتاج محلی را بسنجید.
- ابزارهای nmap و nuclei را نصب کرده و سعی کنید آنها را با اسکریپتهای ساده پایتون به هم متصل کنید.
اما تأثیر این مدلها بر سختافزارهای لبهای حتی پیچیدهتر است؛ به تحلیل ما دربارهی تراشههای NPU مراجعه کنید.




گفتگو