تصور کنید یک عامل هوش مصنوعی بهجای اینکه فقط دستورالعمل تعمیر شیر آب را به شما بگوید، از طریق دوربین گوشی شما نشتی را ببیند، موقعیت دقیق شما را در محل کار شناسایی کند و یک داشبورد وضعیت زنده را در لحظه روی صفحه نمایش شماe ارسال کند. این تغییر رویکرد، یعنی تبدیل گوشی از یک نمایشگر ساده به «بدن» یک عامل فیزیکی، دقیقاً همان چیزی است که OpenClaw را از سایر اپلیکیشنهای هوش مصنوعی متمایز میکند. در واقع، یک گوشی هوشمند زمانی به بدن فیزیکی برای یک عامل AI تبدیل میشود که بهجای اینکه صرفاً یک اپلیکیشن مستقل باشد، به عنوان یک گره جانبی (Peripheral Node) عمل کند.
اکثر برنامههای موبایلی فعلاً صرفاً رابطهایی برای گفتگوهای مبتنی بر ابر هستند. اما OpenClaw — یک پروژه متنباز برای ایجاد هوش مصنوعی شخصی که توسط پیتر استاینبرگر (Peter Steinberger) و با کمک مشارکتکنندگان جامعه توسعهدهندگان خلق شده — «مغز» را از «حواس» جدا میکند. برای تحقق این هدف، اپلیکیشنهای همراه بومی (Native) برای iOS و اندروید منتشر شدهاند تا این معماری خاص را ممکن سازند. اپلیکیشن iOS با عنوان «OpenClaw – AI that does things» در استور ثبت شده و هر دو نسخه موبایل بهصورت رایگان برای دانلود در دسترس هستند. در این مدل، منطق عامل روی یک گیتوی (Gateway) یا درگاه مرکزی که توسط خود کاربر میزبانی میشود قرار دارد و اپلیکیشن موبایل تنها نقش رابط سختافزاری را ایفا میکند. این طراحی به عامل اجازه میدهد تا از طریق حسگرهای گوشی با جهان فیزیکی تعامل داشته باشد، در حالی که دادهها و کنترل اصلی در سرور شخصی کاربر باقی میماند.
همانطور که در تحلیلهای پیشین ما دربارهی رایانش لبه و حریم خصوصی دادهها اشاره کردیم، تفکیک لایهی پردازش از لایهی جمعآوری داده، کلید دستیابی به امنیت واقعی است. این گذار، در واقع تبدیل یک «چتبات» ساده به یک «عامل کاربردی» مجهز به بدن است.
معماری گیتوی و گرهها
طبق مستندات این پروژه، سیستم بر پایه یک صفحهی کنترل مرکزی به نام Gateway عمل میکند. این گیتوی باید روی سیستمعامل macOS، لینوکس یا ویندوز (از طریق WSL2) اجرا شود. گیتوی در واقع «تنها منبع حقیقت» (Single Source of Truth) است؛ به این معنا که مالکیت تمام نشستها (Sessions)، مسیرها (Routing)، کانالها، ابزارها و رویدادها را بر عهده دارد. یک پردازش واحد در گیتوی میتواند همزمان به تمامی کانالها و گرههای متصل سرویس بدهد.
OpenClaw یک پروژه مستقل است و هیچ وابستگی یا ارتباط سازمانی با شرکت آنتروپیک (Anthropic) ندارد. هستهی این سیستم با زبان TypeScript نوشته شده است. برای اجرای بهینه، نسخهی Node 24 پیشنهاد میشود، هرچند سیستم از Node 22.19+ نیز پشتیبانی میکند. این عامل بسیار منعطف است و میتواند با مدلهای محلی، مدلهای اشتراکی مبتنی بر ابر یا مدلهای گیتوی کار کند، به شرطی که کاربر کلید API مربوطه را ارائه دهد. علاوه بر این، سیستم از حافظه پایدار (Persistent Memory) و مهارتها و پلاگینهایی که توسط جامعه کاربران توسعه یافتهاند، پشتیبانی میکند.
تعامل با این عامل از طریق کانالهای چت موجود که کاربر از پیش با آنها آشناست رخ میدهد. به گزارش توسعهدهندگان، کاربر میتواند از طریق واتساپ، تلگرام، دیسکورد، اسلک، سیگنال و iMessage با عامل گفتگو کند. قابلیتهای این سیستم فراتر از چت است و شامل وبگردی، اجرای دستورات شل (Shell) در سیستم و خواندن یا نوشتن فایلها میشود.
اتصال و جفتسازی
گوشیها از طریق پروتکل WebSocket روی پورت پیشفرض ۱۸۷۸۹ به عنوان «گرههای همراه» (Companion Nodes) به گیتوی متصل میشوند. در طی فرآیند جفتسازی، هر گره بهطور مشخص با نقش «node» ثبت میگردد. مستندات پروژه در این مورد صریح است: «گرهها تجهیزات جانبی هستند، نه گیتوی».
در محیط شبکههای محلی، اپلیکیشنها برای شناسایی یکدیگر از mDNS/Bonjour استفاده میکنند. برای دسترسی از راه دور (Remote Access)، پروژه استفاده از Tailscale با یک نقطه پایانی wss:// را توصیه میکند. امنیت در این سیستم بهطور جدی پیادهسازی شده است؛ اعتبارنامههای جفتسازی روی خود دستگاه ذخیره میشوند و هر اتصال گره پیش از آنکه بتواند به گیتوی برسد، نیاز به تأیید صریح اپراتور دارد. علاوه بر این، برای جلوگیری از ارتقای سطح دسترسی، امکان استفاده از چرخش توکن (Token Rotation) برای تغییر نقش یک گره به نقش دیگر وجود ندارد.
قابلیتهای سختافزاری در هر پلتفرم
اپلیکیشنهای موبایلی دسترسی گستردهای را به سطح دستورات عامل از طریق متد node.invoke فراهم میکنند. این خانوادههای دستوری شامل canvas.* ،camera.* ،device.* ،notifications.* و system.* است.
در سیستمعامل iOS (که نیازمند نسخه ۱۸.۰ یا بالاتر است)، کاربران میتوانند از طریق کد QR یا کد تنظیمات جفتسازی کنند. اپلیکیشن iOS قابلیتهای زیر را پشتیبانی میکند:
- ضبط تصویر (Camera Capture) و اسکرینشات از صفحه
- دسترسی به موقعیت مکانی، گالری عکسها و لیست مخاطبان
- دسترسی به تقویم و یادآورها
- حالت گفتگو (Talk mode) بهصورت زمان-واقعی و در پسزمینه
- قابلیت اشتراکگذاری مستقیم متنها، لینکها و رسانهها از محیط iOS به داخل OpenClaw
در اندروید، این اپلیکیشن به عنوان یک گره همراه عمل کرده و ادغامهای عمیقتری را ارائه میدهد:
- استریم پاسخهای چت، پیوستهای تصویری و دسترسی به تاریخچه کامل نشستها
- دسترسی به پیامکهای SMS و حسگرهای حرکتی (Motion Sensors)
- ادغام حالت گفتگو با استفاده از ElevenLabs یا موتور TTS سیستم
- ارائه یک سطح Canvas زنده که به عامل اجازه میدهد داشبوردها و ابزارهای بصری را رندر کند
- ادغام کامل با اعلانها، دوربین، عکسها، ضبط صفحه و موقعیت مکانی
کنترل دسترسی و حریم خصوصی
برای جلوگیری از دسترسیهای غیرمجاز به سختافزار، OpenClaw یک مدل مجوزدهی سختگیرانه را پیاده کرده است. دستوراتی که حساسیت بالایی در زمینه حریم خصوصی دارند — مانند camera.snap برای عکسبرداری، camera.clip برای ضبط ویدئو و screen.record برای ضبط صفحه — بهصورت پیشفرض غیرفعال هستند و تا زمانی که کاربر آنها را در «لیست سفید» قرار ندهد، خاموش میمانند.
کاربران باید با اضافه کردن این دستورات به فایل پیکربندی openclaw.json بهطور صریح اجازه دسترسی را صادر کنند. برای مثال:
{
"gateway": {
"nodes": {
"allowCommands": ["camera.snap", "screen.record"],
},
},
}
در این سیستم، یک لیست سیاه (gateway.nodes.denyCommands) وجود دارد که همواره اولویت آن بالاتر از لیست سفید است؛ این امر تضمین میکند که کاربر قدرت نهایی و تصمیمگیرنده در مورد دسترسی به حسگرهای دستگاه است. علاوه بر این، اتصالات ساده ws:// (بدون رمزنگاری) تنها به شبکههای محلی (LAN) و میزبانهای .local محدود شدهاند و برای تمامی نقاط اتصال عمومی، استفاده از یک نقطه پایانی TLS واقعی (wss://) اجباری است.
استقرار و راهاندازی
راهاندازی یک گره نیازمند اجرای چند دستور در ترمینال دستگاه میزبان است. کاربران ابتدا باید ابزار را نصب کرده و دیمون (Daemon) را فعال کنند:npm install -g openclaw@latestopenclaw onboard --install-daemon
پس از اینکه اپلیکیشن روی گوشی اجرا شد، یک درخواست جفتسازی ارسال میکند. در این مرحله، اپراتور باید از طریق CLI گیتوی، دستگاه را با دنبال کردن این توالی تایید کند:
۱. دستور openclaw devices list (برای یافتن requestId یا شناسه درخواست)
۲. دستور openclaw devices approve <requestId> (برای تایید دستگاه)
۳. دستور openclaw nodes status (برای تایید نهایی جفتسازی و اتصال گره)
بر اساس اطلاعات ثبت شده در اپاستور و گوگلپلی، هر دو نسخه iOS و اندروید گزارش کردهاند که هیچگونه دادهای را جمعآوری نمیکنند.
کاربردهای عملی
این ادغام فیزیکی گوشی با هوش مصنوعی، اجازه میدهد گردشهای کاری پیچیده و حساس به متن (Context-Aware) ایجاد شود:
- جمعآوری دادههای میدانی: در یک سایت عملیاتی یا کارگاه، عامل از دوربین iOS برای عکسبرداری از شرایط محیطی استفاده میکند و همزمان هر عکس را با مختصات GPS برچسبگذاری (Tagging) میکند.
- یادآوریهای مکانمحور: عامل میتواند یک وظیفه یا یادآوری خاص را دقیقاً زمانی فعال کند که کاربر به یک مکان فیزیکی تعیینشده برسد.
- اتوماسیون اندروید: عامل قادر است اعلانهای دریافتی در اندروید را بخواند و بلافاصله پیشنویس یک پاسخ مناسب را آماده کند.
- تجسم آنی: عامل میتواند یک سطح Canvas زنده را روی صفحه گوشی فشار دهد (Push) تا یک داشبورد مدیریتی یا ابزاری را نمایش دهد.
- عملیات بدون دست: حالت Talk Mode امکان برقراری یک مکالمه صوتی سیال، مداوم و بدون نیاز به تایپ را فراهم میکند.
تحلیل: چرخش به سمت عاملیت محلی
این معماری شکافی حیاتی در استقرار فعلی هوش مصنوعی را پر میکند: تضاد بین راحتی ابری و حریم خصوصی محلی. با نگه داشتن گیتوی روی یک سرور خصوصی، کاربران از ارسال کل زنجیره ابزارها (Tool-chain) و وضعیت حافظه خود به تامینکنندگان شخص ثالث خلاص میشوند.
برای کاربر نهایی، این به معنای آن است که هوش مصنوعی دیگر یک تب در مرورگر یا یک اپلیکیشن ایزوله نیست، بلکه ابزاری است که با سختافزار ادغام شده است. این رویکرد، گوشی را از یک دستگاه مصرفکننده (Consumption Device) به یک آرایهٔ حسگر برای یک هوش شخصی و میزبانیشده تبدیل میکند. این موضوع، مفهوم «هوش مصنوعی لبه» (Edge AI) را ارتقا میدهد، زیرا بهجای تمرکز صرف بر اجرای مدلهای کوچک روی دستگاه، بر «ارکستراسیون» یا مدیریت متمرکز سختافزار تمرکز دارد. این رویکرد با تلاشهایی برای بهینهسازی زیرساختی همسو است، مانند آنچه در چارچوب CANS برای کاهش تأخیر در استنتاج توزیعشده مشاهده میکنیم تا پاسخدهی سیستمهای لبه سریعتر شود.
محدودیتها و گامهای آتی
علیرغم قدرت این سیستم، محدودیتهایی وجود دارد. اپلیکیشنهای موبایلی بدون یک گیتوی در حال اجرا نمیتوانند عمل کنند. همچنین فرآیند راهاندازی شامل چندین لایه فنی از جمله جفتسازی WebSocket و mDNS است. علاوه بر این، دسترسی به دوربین و ضبط صفحه بهطور خاص نیازمند آن است که اپلیکیشن در «پیشزمینه» (Foreground) باشد؛ فراخوانهای پسزمینه برای این ویژگیها با خطا مواجه خواهند شد. در نهایت، با توجه به تعداد دانلودهای بسیار کم در اندروید (۱۰+ دانلود)، این پروژه هنوز در مراحل اولیه ارسال سیگنال و رشد است.
کاربران علاقهمند باید پلاگینهای جامعه OpenClaw را زیر نظر بگیرند تا ببینند چه «مهارتهای» جدیدی به فهرست تواناییهای عامل اضافه میشود. یک حوزه کلیدی برای مشاهده، پایداری فراخوانهای پسزمینه در iOS و گسترش مستمر سطح دستورات node.invoke خواهد بود.
گام بعدی شما
- اگر به حریم خصوصی حساس هستید، یک سرور لینوکس کوچک تهیه کرده و گیتوی OpenClaw را روی آن نصب کنید.
- پلاگینهای جامعهمحور را بررسی کنید تا «مهارتهای» جدیدی به عامل خود بیاموزید.
- پایداری فراخوانهای پسزمینه در iOS را برای اتوماسیونهای حساستر زیر نظر بگیرید.
اما داستان سختافزاری این تحول در لایهی پردازش حتی پیچیدهتر است — برای درک چگونگی بهینهسازی استنتاج در لبه، تحلیل ما دربارهی تراشههای NPU را دنبال کنید.




گفتگو