اگر امروز مدیریت یک مرکز عملیات امنیت (SOC) را بر عهده دارید، تضاد میان قدرت پردازشی هوش مصنوعی و حریم خصوصی دادهها، بزرگترین گلوگاه شماست. جابهجایی هوشمندی از ابر به لبه (Edge) با استفاده از مدلهای زبانی کوچک (SLM)، در حال حل این معضل است. به نقل از راهنمای فنی مفصلی توسط فورکان تاسکین (Furkan Taskin)، متخصص امنیت، که در ۲۰ ژوئن ۲۰۲۶ منتشر شد، صنعت امنیت از رویکرد «یک اندازه برای همه» در مواجهه با هوش مصنوعی فاصله گرفته و به سمت مجموعهای از ابزارهای تخصصی حرکت میکند. این استراتژی دقیقاً شبیه به جعبهابزار یک نجار است؛ همانطور که چکش، پیچگوشتی و اره هر کدام برای انجام کارهای متفاوتی طراحی شدهاند، تکنیکهای مختلف هوش مصنوعی نیز برای حل مسائل امنیتی متفاوت مورد نیاز هستند.
بیشتر سازمانها با قدرت خام مدلهای زبانی بزرگ (LLM) — مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — آشنا هستند. اما این مدلها به خوشههای عظیم GPU (واحد پردازش گرافیکی) نیاز دارند و اغلب ایجاب میکنند که گزارشهای حساس و لاگهای عملیاتی به یک ابرِ شخص ثالث ارسال شوند. در محیطهای امنیتی با ریسک بالا، این یک خط قرمز و امری غیرقابل قبول است. ظهور مدلهای کوچکتر مانند Phi-3، Gemma و Mistral 7B به تیمها اجازه میدهد مدلها را بهصورت محلی روی دیوار آتش (Firewall) یا درگاههای اینترنت اشیا (IoT Gateway) اجرا کنند. این چرخش، مزایای چشمگیری در کاهش تأخیر (Latency) و حفظ حریم خصوصی ایجاد میکند، زیرا دادههای حساس هرگز مجبور نیستند از مرزهای فیزیکی یا مجازی سازمان خارج شوند.

جعبهابزار امنیتی هوش مصنوعی
هوش مصنوعی در امنیت، یک موجودیت واحد نیست، بلکه مجموعهای از تکنیکهای متمایز است. هوش مصنوعی زاینده (Generative AI) — که شبیه به نقاشی است که الگوهای هزاران اثر هنری را یاد گرفته تا آثار جدید خلق کند — عمدتاً برای تولید محتواهای مصنوعی از جمله متن، تصویر، صدا و کد استفاده میشود. این سیستمها بهجای حفظ کردن ساده دادهها، با یادگیری الگوها از مجموعهدادههای عظیم، خروجیهای جدید تولید میکنند.
- برنامههای دفاعی: ساخت آموزشهای آگاهیبخش امنیتی از طریق ایمیلهای فیشینگ شبیهسازیشده، تولید خودکار دستورالعملهای پاسخ به حوادث (Incident Response Playbooks) و پیشنویس گزارشهای فنی.
- برنامههای تهاجمی: مهاجمان برای خلق صداهای جعل عمیق (Deepfake)، کدهای مخرب و ایمیلهای فیشینگ بسیار واقعگرایانه از آن استفاده میکنند. برای مثال، یک هوش مصنوعی زاینده میتواند سبک نوشتاری مدیرعامل را چنان دقیق تقلید کند که یک درخواست شبیهسازیشده «پرداخت فوری»، ۴۰٪ از کارکنان را فریب دهد.
یادگیری ماشین (ML) — شبکهای از سلولهای کوچک، شبیه نقشهٔ مترو، که سیگنال را از ورودی به جواب میرساند — موتور شناسایی الگوهاست. برخلاف برنامهنویسی سنتی که در آن توسعهدهنده «قوانین + داده» را میدهد تا «خروجی» بگیرد، یادگیری ماشین «داده + خروجی» را میگیرد تا خودِ «قوانین» (مدل) را تعریف کند. این امر به سیستمها اجازه میدهد بدون نیاز به قوانین سختافزاری (Hard-coded)، از دادهها یاد بگیرند. کاربردهای رایج امنیتی عبارتاند از:
- فیلتر کردن اسپم و طبقهبندی ایمیلها.
- تشخیص بدافزار از طریق تحلیل رفتار فایل.
- شناسایی ناهنجاریهای شبکه برای یافتن انحرافات از ترافیک عادی.
- تحلیل رفتار کاربر (UBA) برای شناسایی فعالیتهای غیرمعمول؛ مثلاً وقتی بانکی تراکنشی ۵۰۰۰ دلاری از برزیل را برای مشتریای که معمولاً فقط در شهر خود قهوه میخرد، مسدود میکند.
همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، زیربنای ریاضی این مدلها بر پایه یادگیری آماری (Statistical Learning) است که بر «چرایی» و تفسیرپذیری مدل تمرکز دارد. در حالی که یادگیری ماشین بر عملکرد پیشبینیکننده («چه اتفاقی میافتد») تأکید دارد، یادگیری آماری مستقیماً بر تئوریهای آماری استوار است. تکنیکهای کلیدی در این بخش شامل رگرسیون، طبقهبندی، خوشهبندی و تست فرضیه است.
در محیط SOC، این متد برای امتیازدهی ریسک و تعیین خط مبنای رفتار «عادی» استفاده میشود. برای مثال، اگر یک شبکه معمولاً ۵۰ هزار پرسوجوی DNS با انحراف معیار ۵ هزار دارد و ناگهان این عدد به ۲۰۰ هزار برسد (که نشاندهنده ۳۰ انحراف معیار است)، این یک نشانه قطعی از حمله DDoS یا ارتباط یک بدافزار با سرور فرماندهی و کنترل (C2) است.
ترنسفورمرها (Transformers) که گوگل در مقاله سال ۲۰۱۷ با عنوان «Attention Is All You Need» معرفی کرد، با مکانیزم خودتوجهی (Self-attention) این حوزه را متحول کردند. مدلهای قدیمیتر مثل RNNها و LSTMها متن را به صورت خطی (از چپ به راست) میخواندند و اغلب بافت یا Context را در جملات بلند گم میکردند. ترنسفورمرها کل ورودی را یکباره پردازش میکنند. این یعنی مدل میفهمد در جمله «دیو به بانک رفت چون میخواست پول پاس بدهد»، کلمه «او» دقیقاً به «دیو» اشاره دارد.
در امنیت، این قابلیت منجر به موارد زیر میشود:
- تشخیص فیشینگ بر اساس بستر و معنا به جای اکتفا به کلمات کلیدی (مثلاً درک تفاوت میان «این رایگان است» و «این رایگان نیست»).
- تحلیل خودکار گزارشهای پیچیده تهدیدات (Threat Intelligence Reports).
- درک ساختار معنایی کدهای مخرب در حین تحلیل فنی.
یادگیری عمیق (Deep Learning) از شبکههای عصبی با لایههای متعدد برای یادگیری الگوهای پیچیده استفاده میکند. اصطلاح «عمیق» به حضور بیش از یک لایه پنهان اشاره دارد؛ در حالی که یک شبکه تکلایه الگوهای ساده را میشناسد، شبکههایی با ۵۰ یا ۱۰۰ لایه میتوانند الگوهای بسیار پیچیده را شناسایی کنند. یادگیری عمیق زیرمجموعهای از یادگیری ماشین و آن نیز زیرمجموعهای از هوش مصنوعی است.
در حالی که آنتیویروسهای سنتی بر اثرانگشتهای (Fingerprints) استاتیک تکیه دارند، سامانههای تشخیص و پاسخ در نقطه انتهایی (EDR) مبتنی بر یادگیری عمیق، بدافزارهای متغیر (Polymorphic) را از طریق مشاهده رفتار شناسایی میکنند. برای مثال، اگر فایلی سعی کند یک اتصال شبکه پنهان باز کند و سپس شروع به رمزگذاری فایلها کند، EDR الگوی باجافزار را شناسایی کرده و آن را متوقف میکند، فارغ از اینکه اثرانگشت یا امضای فایل چیست.
پردازش زبان طبیعی (NLP) بر زبان انسانی، اعم از گفتار و متن، تمرکز دارد. این تکنیک برای استخراج داده (Scraping) از انجمنهای تاریک (Dark Web)، خلاصهسازی گزارشهای تهدید و تحلیل زبانی پیامهای فیشینگ به کار میرود. این دسته شامل موارد زیر است:
- LLMs: غولهای همهکاره (مثل GPT-4 یا Claude) با میلیاردها یا تریلیونها پارامتر که به قدرت محاسباتی بالایی (خوشههای GPU) نیاز دارند و وظایفی چون ترجمه و خلاصهسازی را بر عهده میگیرند.
- SLMs: مدلهای تخصصی و محدود بر حوزههای خاص با پارامترهای کمتر. این مدلها تأخیر پایینتری دارند، هزینه آموزششان کمتر است و روی دستگاههای لبه یا تکGPU اجرا میشوند؛ ایدهآل برای محیطهای طبقهبندیشده که داده نباید از premises خارج شود.
- شبکههای مولد تخاصمی (GAN) — سیستمی شبیه به «جاعل در برابر کارآگاه» که در آن یک Generator داده جعلی میسازد و یک Discriminator سعی در شناسایی آن دارد. این رقابت، دادههای مصنوعی بسیار واقعگرایانهای تولید میکند. در امنیت، GANها برای تولید سناریوهای کلاهبرداری مصنوعی جهت آموزش مدلهای تشخیص به کار میروند که میتواند نرخ تشخیص کلاهبرداری را تا ۳۵٪ افزایش دهد، یا برای خلق دیپفیکها و تقویت شکستن رمز عبور از طریق یادگیری الگوهای واقعگرایانه رمزها استفاده شوند.
تکنیکهای آموزش و بهینهسازی
آموزش مدل تنها نیمی از مسیر است؛ اعتبارسنجی تضمین میکند که مدل دادهها را صرفاً حفظ نکند، خطایی که به آن بیشبرازش (Overfitting) میگویند (جایی که مدل روی دادههای آموزشی ۹۹٪ دقیق است اما روی دادههای جدید شکست میخورد). متخصصان برای جلوگیری از این اتفاق از روشهای زیر استفاده میکنند:
- تفکیک داده آموزش و آزمون: تقسیم دادهها به تقریباً ۸۰٪ برای آموزش و ۲۰٪ برای تست.
- اعتبارسنجی متقابل (Cross-validation): تقسیم دادهها به K بخش (مثلاً ۵ بخش) که هر یک از این بخشها یکبار به عنوان مجموعه تست عمل کرده و نتایج در نهایت میانگین گرفته میشوند.
- اعتبارسنجی Holdout: کنار گذاشتن بخشی از دادهها به صورت کاملاً مجزا برای ارزیابی نهایی.
در ارزیابی این مدلها، «صحت» (Accuracy) میتواند گمراهکننده باشد. اگر ۹۹.۹٪ فایلها سالم باشند، مدلی که همه را «سالم» برچسب میزند، ۹۹.۹٪ صحت دارد اما عملاً بیاستفاده است. بنابراین متخصصان به دقت (Precision) (از میان تمام موارد علامتگذاری شده، چند مورد واقعاً مخرب بودند) و بازیابی (Recall) (از میان تمام تهدیدات واقعی، چند مورد شناسایی شدند) نگاه میکنند. در امنیت، Recall اولویت دارد چون گم کردن یک تهدید واقعی خطرناکتر از یک هشدار اشتباه است. برای یافتن تعادل میان این دو، از امتیاز F1 استفاده میشود.
یادگیری نظارتشده (Supervised Learning) از دادههای برچسبدار (مثلاً ایمیلهایی که «اسپم» یا «غیراسپم» علامت خوردهاند) استفاده میکند. این روش بسیار دقیق و تفسیرپذیر است اما به دلیل کند بودن فرآیند برچسبگذاری، هزینه تولید دادههای آن بالاست. این روش استاندارد طبقهبندی بدافزارها و تشخیص نفوذ است.
یادگیری بدون نظارت (Unsupervised Learning) روی دادههای بدون برچسب برای کشف ساختارهای پنهان کار میکند. تکنیکهای این بخش شامل خوشهبندی (گروهبندی دادههای مشابه)، کاهش ابعاد و تشخیص ناهنجاری است. این ابزار اصلی شناسایی حملات روز-صفر (Zero-day) و تحلیل رفتار کاربر و موجودیت (UEBA) است. مثلاً یک SIEM میتواند حساب مالی که ساعت ۳ صبح به سرورهای مهندسی دسترسی دارد را به عنوان ناهنجاری رفتاری علامتگذاری کند.
یادگیری تقویتی (Reinforcement Learning) از عاملی استفاده میکند که برای بهدست آوردن بیشترین سیگنال پاداش، در محیط اقدام میکند. برای مثال، یک ابزار تست نفوذ خودکار ممکن است برای اکسپلویت موفق +۱۰ امتیاز و برای شناسایی شدن توسط سیستم دفاعی -۵ امتیاز بگیرد. با زمان، این عامل موثرترین توالی حملات را یاد میگیرد و کاری را که انسان در هفتهها انجام میدهد، در چند ساعت به سرانجام برساند.
برای تخصصی کردن این مدلها، تیمهای امنیتی از تنظیم دقیق (Fine-tuning) استفاده میکنند (شبیه به وقتی که یک دانشجوی پزشکی در رشته قلب تخصص میگیرد). این کار بسیار ارزانتر از آموزش از صفر است، زیرا آموزش اولیه میتواند میلیونها دلار هزینه و هفتهها زمان GPU ببرد. این فرآیند شامل موارد زیر میشود:
- Epoch: یک دور کامل پیمایش کل دادههای آموزشی. تعداد کم منجر به کمبرازش (Underfitting) و تعداد زیاد منجر به بیشبرازش میشود. در آموزش اغلب از «توقف زودهنگام» (Early Stopping) استفاده میشود، یعنی زمانی که کاهش خطای اعتبارسنجی متوقف و روند صعودی شروع شود.
- هرس کردن (Pruning): حذف وزنها یا نرونهای کماثر. این کار میتواند به صورت هرس وزنی (صفر کردن وزنهای کوچک) یا هرس نرونی/فیلتری (حذف کل لایهها) باشد. این کار مدل را برای استقرار روی گیتویهای IoT کوچک میکند.
- کوانتیزاسیون (Quantization): کاهش دقت عددی برای افزایش سرعت و کاهش حجم. این کار شامل تبدیل از FP32 (اعشاری ۳۲ بیتی) به FP16، INT8 یا حتی INT4 است. برای مثال، هرس کردن و کوانتای به INT8 میتواند مدلی ۲ گیگابایتی را به ۲۰۰ مگابایت برساند، در حالی که تنها ۲٪ از صحت مدل کاهش مییابد و روی یک گیتوی مبتنی بر ARM اجرا شود.
هنر مهندسی پرامپت
دریافت خروجی مفید بیش از یک سؤال ساده است. پرامپتهای سیستمی (System Prompts) هویت، رفتار و محدودیتهای AI را در پسزمینه تعریف میکنند. برای مثال، پرامپت سیستمی میتواند دستور دهد که مدل به عنوان متخصص امنیت عمل کند، توصیههای دفاعمحور ارائه دهد و هرگز کد اکسپلویت فعال را به اشتراک نگذارد. این پرامپتها مرزهای امنیتی را تعیین میکنند؛ اگر ضعیف نوشته شوند، در برابر تزریق پرامپت (Prompt Injection) آسیبپذیرند.
پرامپتهای کاربر (User Prompts) درخواستهای مشخصی هستند که در این چارچوب پردازش میشوند؛ مثل تحلیل ۵۰۰ خط لاگ ورود ناموفق برای شناسایی یک تهدید.
استراتژیهای مختلف پرامپتنویسی نتایج متفاوتی دارند:
- Zero-shot: انجام تکلیف بدون هیچ مثالی. سریع است اما دقت کمتری در کارهای تخصصی امنیتی دارد.
- One-shot: ارائه یک مثال برای نشان دادن فرمت یا سبک تحلیل مورد نظر به مدل.
- Multi-shot: ارائه چندین مثال برای آموزش منطقهای تصمیمگیری پیچیده؛ این روش دقیقترین است اما هزینه توکن (Token) و مصرف منابع را بالا میبرد.
کاربران پیشرفته از نقشهای سیستمی (System Roles) برای تخصیص پرسونا استفاده میکنند، مثلاً «تحلیلگر SOC سطح ۳ با ۱۵ سال تجربه و تسلط عمیق بر چارچوب MITRE ATT&CK». این کار تضمین میکند مدل یک گردش کار مشخص را دنبال کند: ابتدا شناسایی تاکتیک، سپس ارزیابی اثر و در نهایت ترسیم راهکار اصلاحی.
در نهایت، قالبهای پرامپت (Prompt Templates) برای ایجاد ساختارهای بازاستفادهکننده با متغیرها (مثلاً {source_ip} یا {log_data}) به کار میروند. یک ارائهدهنده خدمات امنیتی (MSSP) با این قالبها تضمین میکند ۱۰ تحلیلگر مختلف، خروجیهای یکسانی تولید کنند که میتواند زمان SLA را تا ۶۰٪ کاهش دهد و ریسک تزریق پرامپت را با کنترل محل قرارگیری ورودی کاربر کاهش دهد.
این چرخش به سمت مدلهای تخصصی، هرسشده و کوانتایز شده به این معناست که آینده امنیت نه در دست کسی است که بزرگترین مدل را دارد، بلکه در دست کسی است که بهینهترین مدل را در شبکه خود جایگذاری کرده است. این تحول، این فرض قدیمی را که AI با عملکرد بالا حتماً نیاز به اتصال ابری دارد، میشکند. برای بهکارگیری این مفاهیم، متخصصان امنیتی باید بررسی کنند که کجا یک SLM میتواند جایگزین LLM ابری شود تا حریم خصوصی و سرعت افزایش یابد.
گام بعدی شما
- جریانهای کاری فعلی هوش مصنوعی خود را بررسی کنید تا نقاطی را که یک SLM میتواند جایگزین LLM ابری شود (برای حریم خصوصی و سرعت بیشتر) شناسایی کنید.
- بررسی کنید آیا از قالبهای استاندارد پرامپت برای یکسانسازی خروجیهای تیم تحلیل خود استفاده میکنید یا خیر.
- مدلهای کوچکتر مانند Phi-3 یا Gemma را در محیطهای ایزوله تست کنید تا تأثیر کوانتایزاسیون بر دقت شناسایی بدافزارها در شبکه خود را بسنجید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما دربارهی تراشههای Blackwell مراجعه کنید.




گفتگو