اگر امروز یک توسعهدهنده هستید که برای اتوماسیونِ کارهای تکراری از چندین ابزار مجزا استفاده میکنید، باید بدانید که مرز بین «چتبات» و «اپراتور» در حال محو شدن است. گوگل حالا اجازه میدهد هوش مصنوعی بهجای پیشنهاد دادنِ یک برنامه، مستقیماً آن را در سیستمعامل شما اجرا کند. این تحول در اتوماسیون، یادآور رقابتهای جاری میان ابزارهای بصری و کدنویسی است؛ جایی که مقایسهی اتوماسیون بصری n8n با اسکریپتهای پایتون نشان داد که سرعت پیادهسازی در محیطهای گرافیکی تا چه حد با کدنویسی دستی متفاوت است.
طبق اعلام گوگل در پست وبلاگی به تاریخ ۲۴ ژوئن ۲۰۲۶، قابلیت استفاده از کامپیوتر (Computer Use) اکنون بهطور بومی در هستهٔ Gemini 3.5 Flash ادغام شده است. این یعنی مدل زبانی بزرگ (LLM) — شبیه کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب میدهد — دیگر برای مدیریت دسکتاپ به یک مدلِ کمکی یا خارجی نیاز ندارد. همانطور که در تحلیل قبلی ما دربارهی چالشهای سختافزاری Google Home Speaker اشاره کردیم، گوگل پیشتر در پیوند دادن مدلهایش به سختافزار با دشواریهایی روبرو بود؛ اما این بهروزرسانی دقیقاً روی لایه نرمافزاری تمرکز دارد تا کارهای پیچیدهٔ اداری و تستهای نرمافزاری را خودکار کند. این پیشرفت در مدلهای خانواده Flash، در ادامهی بهبودهای متوالی است؛ برای مثال قابلیت کنترل احساسات صدا در Gemini 3.1 Flash گام مهمی در جهت طبیعیتر کردن تعاملات صوتی بود.
به نقل از مستندات گوگل، جایگزینی مدل مستقل ۲.۵ Computer Use با ادغام بومی در نسخه ۳.۵ Flash، باعث رسیدن به بالاترین سطح عملکرد در کارهای عاملمحور (Agentic) شده است. این سیستم از نقاط قوت فعلی در فراخوانی تابع (Function Calling) و مبنیسازی (Grounding) از طریق Maps و Search بهره میبرد. در همین راستا، رقبا نیز تلاش میکنند تا فرآیندهای چندمرحلهای را ساده کنند، مشابه آنچه در حالت goal مدل Grok Build برای خودکارسازی کدنویسی مشاهده کردیم.

برای مدیریت امنیت در محیطهای عملیاتی، گوگل سه لایه حفاظتی تعریف کرده است:
- آموزش خصمانه (Adversarial Training) هدفمند برای کاهش ریسک تزریق پرامپت (Prompt Injection).
- سامانه تأییدیه که برای اقدامات حساس یا غیرقابل بازگشت، تأیید صریح کاربر را میخواهد.
- توقف خودکار تسک زمانی که تزریقهای غیرمستقیم پرامپت شناسایی شوند.
این تغییر برای کسبوکارها به این معناست که هوش مصنوعی از یک مشاور ساده به یک اپراتور تبدیل میشود. شرکتها با ترکیب محیطهای ایزوله (Sandboxing) و تأیید انسانی، میتوانند زنجیرهای از کارهای طولانی را که پیشتر نیاز به نظارت دستی در چندین اپلیکیشن داشت، کاملاً خودکار کنند.
توسعهدهندگان اکنون میتوانند از این قابلیتها از طریق Gemini API و پلتفرم Gemini Enterprise Agent Platform استفاده کنند. همچنین محیط دموی Browserbase برای تست فوری این ابزارها در دسترس است.
گام بعدی شما
- اگر از Gemini API استفاده میکنید، قابلیتهای جدید را در محیط Sandbox تست کنید تا ریسک اجرای دستورات اشتباه کاهش یابد.
- گردشهای کاری (Workflows) تکراری خود را شناسایی کنید و ببینید کدام بخشها را میتوان به عاملهای بومی 3.5 Flash سپرد.
- مستندات امنیتی گوگل درباره «تأییدیه کاربر» را بخوانید تا بدانید کجا باید کنترل انسانی را حفظ کنید.
اما تأثیر این ادغام بر رقابت با عاملهای OpenAI در لبهٔ سیستمعامل، ابعادی پیچیدهتر دارد — به تحلیل ما دربارهی استراتژیهای اکوسیستم عاملهای AI مراجعه کنید.




گفتگو