«برتری مدل‌های کوچک»، رویکرد جدید در مقابله با حملات سایبری

اگر امروز مدیریت یک مرکز عملیات امنیت (SOC) را بر عهده دارید، تضاد میان قدرت پردازشی هوش مصنوعی و حریم خصوصی داده‌ها، بزرگ‌ترین گلوگاه شماست. جابه‌جایی هوشمندی از ابر به لبه (Edge) با استفاده از مدل‌های زبانی کوچک (SLM)، در حال حل این معضل است. به نقل از راهنمای فنی مفصلی توسط فورکان تاسکین (Furkan Taskin)، متخصص امنیت، که در ۲۰ ژوئن ۲۰۲۶ منتشر شد، صنعت امنیت از رویکرد «یک اندازه برای همه» در مواجهه با هوش مصنوعی فاصله گرفته و به سمت مجموعه‌ای از ابزارهای تخصصی حرکت می‌کند. این استراتژی دقیقاً شبیه به جعبه‌ابزار یک نجار است؛ همان‌طور که چکش، پیچ‌گوشتی و اره هر کدام برای انجام کارهای متفاوتی طراحی شده‌اند، تکنیک‌های مختلف هوش مصنوعی نیز برای حل مسائل امنیتی متفاوت مورد نیاز هستند.

بیشتر سازمان‌ها با قدرت خام مدل‌های زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — آشنا هستند. اما این مدل‌ها به خوشه‌های عظیم GPU (واحد پردازش گرافیکی) نیاز دارند و اغلب ایجاب می‌کنند که گزارش‌های حساس و لاگ‌های عملیاتی به یک ابرِ شخص ثالث ارسال شوند. در محیط‌های امنیتی با ریسک بالا، این یک خط قرمز و امری غیرقابل قبول است. ظهور مدل‌های کوچک‌تر مانند Phi-3، Gemma و Mistral 7B به تیم‌ها اجازه می‌دهد مدل‌ها را به‌صورت محلی روی دیوار آتش (Firewall) یا درگاه‌های اینترنت اشیا (IoT Gateway) اجرا کنند. این چرخش، مزایای چشمگیری در کاهش تأخیر (Latency) و حفظ حریم خصوصی ایجاد می‌کند، زیرا داده‌های حساس هرگز مجبور نیستند از مرزهای فیزیکی یا مجازی سازمان خارج شوند.

مقایسه انواع هوش مصنوعی و روش‌های مورد استفاده در امنیت سایبری

جعبه‌ابزار امنیتی هوش مصنوعی

هوش مصنوعی در امنیت، یک موجودیت واحد نیست، بلکه مجموعه‌ای از تکنیک‌های متمایز است. هوش مصنوعی زاینده (Generative AI) — که شبیه به نقاشی است که الگوهای هزاران اثر هنری را یاد گرفته تا آثار جدید خلق کند — عمدتاً برای تولید محتواهای مصنوعی از جمله متن، تصویر، صدا و کد استفاده می‌شود. این سیستم‌ها به‌جای حفظ کردن ساده داده‌ها، با یادگیری الگوها از مجموعه‌داده‌های عظیم، خروجی‌های جدید تولید می‌کنند.

برنامه‌های دفاعی: ساخت آموزش‌های آگاهی‌بخش امنیتی از طریق ایمیل‌های فیشینگ شبیه‌سازی‌شده، تولید خودکار دستورالعمل‌های پاسخ به حوادث (Incident Response Playbooks) و پیش‌نویس گزارش‌های فنی.
برنامه‌های تهاجمی: مهاجمان برای خلق صداهای جعل عمیق (Deepfake)، کدهای مخرب و ایمیل‌های فیشینگ بسیار واقع‌گرایانه از آن استفاده می‌کنند. برای مثال، یک هوش مصنوعی زاینده می‌تواند سبک نوشتاری مدیرعامل را چنان دقیق تقلید کند که یک درخواست شبیه‌سازی‌شده «پرداخت فوری»، ۴۰٪ از کارکنان را فریب دهد.

یادگیری ماشین (ML) — شبکه‌ای از سلول‌های کوچک، شبیه نقشهٔ مترو، که سیگنال را از ورودی به جواب می‌رساند — موتور شناسایی الگوهاست. برخلاف برنامه‌نویسی سنتی که در آن توسعه‌دهنده «قوانین + داده» را می‌دهد تا «خروجی» بگیرد، یادگیری ماشین «داده + خروجی» را می‌گیرد تا خودِ «قوانین» (مدل) را تعریف کند. این امر به سیستم‌ها اجازه می‌دهد بدون نیاز به قوانین سخت‌افزاری (Hard-coded)، از داده‌ها یاد بگیرند. کاربردهای رایج امنیتی عبارت‌اند از:

فیلتر کردن اسپم و طبقه‌بندی ایمیل‌ها.
تشخیص بدافزار از طریق تحلیل رفتار فایل.
شناسایی ناهنجاری‌های شبکه برای یافتن انحرافات از ترافیک عادی.
تحلیل رفتار کاربر (UBA) برای شناسایی فعالیت‌های غیرمعمول؛ مثلاً وقتی بانکی تراکنشی ۵۰۰۰ دلاری از برزیل را برای مشتری‌ای که معمولاً فقط در شهر خود قهوه می‌خرد، مسدود می‌کند.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، زیربنای ریاضی این مدل‌ها بر پایه یادگیری آماری (Statistical Learning) است که بر «چرایی» و تفسیرپذیری مدل تمرکز دارد. در حالی که یادگیری ماشین بر عملکرد پیش‌بینی‌کننده («چه اتفاقی می‌افتد») تأکید دارد، یادگیری آماری مستقیماً بر تئوری‌های آماری استوار است. تکنیک‌های کلیدی در این بخش شامل رگرسیون، طبقه‌بندی، خوشه‌بندی و تست فرضیه است.

در محیط SOC، این متد برای امتیازدهی ریسک و تعیین خط مبنای رفتار «عادی» استفاده می‌شود. برای مثال، اگر یک شبکه معمولاً ۵۰ هزار پرس‌وجوی DNS با انحراف معیار ۵ هزار دارد و ناگهان این عدد به ۲۰۰ هزار برسد (که نشان‌دهنده ۳۰ انحراف معیار است)، این یک نشانه قطعی از حمله DDoS یا ارتباط یک بدافزار با سرور فرماندهی و کنترل (C2) است.

ترنسفورمرها (Transformers) که گوگل در مقاله سال ۲۰۱۷ با عنوان «Attention Is All You Need» معرفی کرد، با مکانیزم خودتوجهی (Self-attention) این حوزه را متحول کردند. مدل‌های قدیمی‌تر مثل RNNها و LSTMها متن را به صورت خطی (از چپ به راست) می‌خواندند و اغلب بافت یا Context را در جملات بلند گم می‌کردند. ترنسفورمرها کل ورودی را یک‌باره پردازش می‌کنند. این یعنی مدل می‌فهمد در جمله «دیو به بانک رفت چون می‌خواست پول پاس بدهد»، کلمه «او» دقیقاً به «دیو» اشاره دارد.

در امنیت، این قابلیت منجر به موارد زیر می‌شود:

تشخیص فیشینگ بر اساس بستر و معنا به جای اکتفا به کلمات کلیدی (مثلاً درک تفاوت میان «این رایگان است» و «این رایگان نیست»).
تحلیل خودکار گزارش‌های پیچیده تهدیدات (Threat Intelligence Reports).
درک ساختار معنایی کدهای مخرب در حین تحلیل فنی.

یادگیری عمیق (Deep Learning) از شبکه‌های عصبی با لایه‌های متعدد برای یادگیری الگوهای پیچیده استفاده می‌کند. اصطلاح «عمیق» به حضور بیش از یک لایه پنهان اشاره دارد؛ در حالی که یک شبکه تک‌لایه الگوهای ساده را می‌شناسد، شبکه‌هایی با ۵۰ یا ۱۰۰ لایه می‌توانند الگوهای بسیار پیچیده را شناسایی کنند. یادگیری عمیق زیرمجموعه‌ای از یادگیری ماشین و آن نیز زیرمجموعه‌ای از هوش مصنوعی است.

در حالی که آنتی‌ویروس‌های سنتی بر اثر‌انگشت‌های (Fingerprints) استاتیک تکیه دارند، سامانه‌های تشخیص و پاسخ در نقطه انتهایی (EDR) مبتنی بر یادگیری عمیق، بدافزارهای متغیر (Polymorphic) را از طریق مشاهده رفتار شناسایی می‌کنند. برای مثال، اگر فایلی سعی کند یک اتصال شبکه پنهان باز کند و سپس شروع به رمزگذاری فایل‌ها کند، EDR الگوی باج‌افزار را شناسایی کرده و آن را متوقف می‌کند، فارغ از اینکه اثر‌انگشت یا امضای فایل چیست.

پردازش زبان طبیعی (NLP) بر زبان انسانی، اعم از گفتار و متن، تمرکز دارد. این تکنیک برای استخراج داده (Scraping) از انجمن‌های تاریک (Dark Web)، خلاصه‌سازی گزارش‌های تهدید و تحلیل زبانی پیام‌های فیشینگ به کار می‌رود. این دسته شامل موارد زیر است:

LLMs: غول‌های همه‌کاره (مثل GPT-4 یا Claude) با میلیاردها یا تریلیون‌ها پارامتر که به قدرت محاسباتی بالایی (خوشه‌های GPU) نیاز دارند و وظایفی چون ترجمه و خلاصه‌سازی را بر عهده می‌گیرند.
SLMs: مدل‌های تخصصی و محدود بر حوزه‌های خاص با پارامترهای کمتر. این مدل‌ها تأخیر پایین‌تری دارند، هزینه آموزششان کمتر است و روی دستگاه‌های لبه یا تک‌GPU اجرا می‌شوند؛ ایده‌آل برای محیط‌های طبقه‌بندی‌شده که داده نباید از premises خارج شود.
شبکه‌های مولد تخاصمی (GAN) — سیستمی شبیه به «جاعل در برابر کارآگاه» که در آن یک Generator داده جعلی می‌سازد و یک Discriminator سعی در شناسایی آن دارد. این رقابت، داده‌های مصنوعی بسیار واقع‌گرایانه‌ای تولید می‌کند. در امنیت، GANها برای تولید سناریوهای کلاهبرداری مصنوعی جهت آموزش مدل‌های تشخیص به کار می‌روند که می‌تواند نرخ تشخیص کلاهبرداری را تا ۳۵٪ افزایش دهد، یا برای خلق دیپ‌فیک‌ها و تقویت شکستن رمز عبور از طریق یادگیری الگوهای واقع‌گرایانه رمزها استفاده شوند.

تکنیک‌های آموزش و بهینه‌سازی

آموزش مدل تنها نیمی از مسیر است؛ اعتبارسنجی تضمین می‌کند که مدل داده‌ها را صرفاً حفظ نکند، خطایی که به آن بیش‌برازش (Overfitting) می‌گویند (جایی که مدل روی داده‌های آموزشی ۹۹٪ دقیق است اما روی داده‌های جدید شکست می‌خورد). متخصصان برای جلوگیری از این اتفاق از روش‌های زیر استفاده می‌کنند:

تفکیک داده آموزش و آزمون: تقسیم داده‌ها به تقریباً ۸۰٪ برای آموزش و ۲۰٪ برای تست.
اعتبارسنجی متقابل (Cross-validation): تقسیم داده‌ها به K بخش (مثلاً ۵ بخش) که هر یک از این بخش‌ها یک‌بار به عنوان مجموعه تست عمل کرده و نتایج در نهایت میانگین گرفته می‌شوند.
اعتبارسنجی Holdout: کنار گذاشتن بخشی از داده‌ها به صورت کاملاً مجزا برای ارزیابی نهایی.

در ارزیابی این مدل‌ها، «صحت» (Accuracy) می‌تواند گمراه‌کننده باشد. اگر ۹۹.۹٪ فایل‌ها سالم باشند، مدلی که همه را «سالم» برچسب می‌زند، ۹۹.۹٪ صحت دارد اما عملاً بی‌استفاده است. بنابراین متخصصان به دقت (Precision) (از میان تمام موارد علامت‌گذاری شده، چند مورد واقعاً مخرب بودند) و بازیابی (Recall) (از میان تمام تهدیدات واقعی، چند مورد شناسایی شدند) نگاه می‌کنند. در امنیت، Recall اولویت دارد چون گم کردن یک تهدید واقعی خطرناک‌تر از یک هشدار اشتباه است. برای یافتن تعادل میان این دو، از امتیاز F1 استفاده می‌شود.

یادگیری نظارت‌شده (Supervised Learning) از داده‌های برچسب‌دار (مثلاً ایمیل‌هایی که «اسپم» یا «غیراسپم» علامت خورده‌اند) استفاده می‌کند. این روش بسیار دقیق و تفسیرپذیر است اما به دلیل کند بودن فرآیند برچسب‌گذاری، هزینه تولید داده‌های آن بالاست. این روش استاندارد طبقه‌بندی بدافزارها و تشخیص نفوذ است.

یادگیری بدون نظارت (Unsupervised Learning) روی داده‌های بدون برچسب برای کشف ساختارهای پنهان کار می‌کند. تکنیک‌های این بخش شامل خوشه‌بندی (گروه‌بندی داده‌های مشابه)، کاهش ابعاد و تشخیص ناهنجاری است. این ابزار اصلی شناسایی حملات روز-صفر (Zero-day) و تحلیل رفتار کاربر و موجودیت (UEBA) است. مثلاً یک SIEM می‌تواند حساب مالی که ساعت ۳ صبح به سرورهای مهندسی دسترسی دارد را به عنوان ناهنجاری رفتاری علامت‌گذاری کند.

یادگیری تقویتی (Reinforcement Learning) از عاملی استفاده می‌کند که برای به‌دست آوردن بیشترین سیگنال پاداش، در محیط اقدام می‌کند. برای مثال، یک ابزار تست نفوذ خودکار ممکن است برای اکسپلویت موفق +۱۰ امتیاز و برای شناسایی شدن توسط سیستم دفاعی -۵ امتیاز بگیرد. با زمان، این عامل موثرترین توالی حملات را یاد می‌گیرد و کاری را که انسان در هفته‌ها انجام می‌دهد، در چند ساعت به سرانجام برساند.

برای تخصصی کردن این مدل‌ها، تیم‌های امنیتی از تنظیم دقیق (Fine-tuning) استفاده می‌کنند (شبیه به وقتی که یک دانشجوی پزشکی در رشته قلب تخصص می‌گیرد). این کار بسیار ارزان‌تر از آموزش از صفر است، زیرا آموزش اولیه می‌تواند میلیون‌ها دلار هزینه و هفته‌ها زمان GPU ببرد. این فرآیند شامل موارد زیر می‌شود:

Epoch: یک دور کامل پیمایش کل داده‌های آموزشی. تعداد کم منجر به کم‌برازش (Underfitting) و تعداد زیاد منجر به بیش‌برازش می‌شود. در آموزش اغلب از «توقف زودهنگام» (Early Stopping) استفاده می‌شود، یعنی زمانی که کاهش خطای اعتبارسنجی متوقف و روند صعودی شروع شود.
هرس کردن (Pruning): حذف وزن‌ها یا نرون‌های کم‌اثر. این کار می‌تواند به صورت هرس وزنی (صفر کردن وزن‌های کوچک) یا هرس نرونی/فیلتری (حذف کل لایه‌ها) باشد. این کار مدل را برای استقرار روی گیت‌وی‌های IoT کوچک می‌کند.
کوانتیزاسیون (Quantization): کاهش دقت عددی برای افزایش سرعت و کاهش حجم. این کار شامل تبدیل از FP32 (اعشاری ۳۲ بیتی) به FP16، INT8 یا حتی INT4 است. برای مثال، هرس کردن و کوانتای به INT8 می‌تواند مدلی ۲ گیگابایتی را به ۲۰۰ مگابایت برساند، در حالی که تنها ۲٪ از صحت مدل کاهش می‌یابد و روی یک گیت‌وی مبتنی بر ARM اجرا شود.

هنر مهندسی پرامپت

دریافت خروجی مفید بیش از یک سؤال ساده است. پرامپت‌های سیستمی (System Prompts) هویت، رفتار و محدودیت‌های AI را در پس‌زمینه تعریف می‌کنند. برای مثال، پرامپت سیستمی می‌تواند دستور دهد که مدل به عنوان متخصص امنیت عمل کند، توصیه‌های دفاع‌محور ارائه دهد و هرگز کد اکسپلویت فعال را به اشتراک نگذارد. این پرامپت‌ها مرزهای امنیتی را تعیین می‌کنند؛ اگر ضعیف نوشته شوند، در برابر تزریق پرامپت (Prompt Injection) آسیب‌پذیرند.

پرامپت‌های کاربر (User Prompts) درخواست‌های مشخصی هستند که در این چارچوب پردازش می‌شوند؛ مثل تحلیل ۵۰۰ خط لاگ ورود ناموفق برای شناسایی یک تهدید.

استراتژی‌های مختلف پرامپت‌نویسی نتایج متفاوتی دارند:

Zero-shot: انجام تکلیف بدون هیچ مثالی. سریع است اما دقت کمتری در کارهای تخصصی امنیتی دارد.
One-shot: ارائه یک مثال برای نشان دادن فرمت یا سبک تحلیل مورد نظر به مدل.
Multi-shot: ارائه چندین مثال برای آموزش منطق‌های تصمیم‌گیری پیچیده؛ این روش دقیق‌ترین است اما هزینه توکن (Token) و مصرف منابع را بالا می‌برد.

کاربران پیشرفته از نقش‌های سیستمی (System Roles) برای تخصیص پرسونا استفاده می‌کنند، مثلاً «تحلیلگر SOC سطح ۳ با ۱۵ سال تجربه و تسلط عمیق بر چارچوب MITRE ATT&CK». این کار تضمین می‌کند مدل یک گردش کار مشخص را دنبال کند: ابتدا شناسایی تاکتیک، سپس ارزیابی اثر و در نهایت ترسیم راهکار اصلاحی.

در نهایت، قالب‌های پرامپت (Prompt Templates) برای ایجاد ساختارهای بازاستفاده‌کننده با متغیرها (مثلاً {source_ip} یا {log_data}) به کار می‌روند. یک ارائه‌دهنده خدمات امنیتی (MSSP) با این قالب‌ها تضمین می‌کند ۱۰ تحلیلگر مختلف، خروجی‌های یکسانی تولید کنند که می‌تواند زمان SLA را تا ۶۰٪ کاهش دهد و ریسک تزریق پرامپت را با کنترل محل قرارگیری ورودی کاربر کاهش دهد.

این چرخش به سمت مدل‌های تخصصی، هرس‌شده و کوانتایز شده به این معناست که آینده امنیت نه در دست کسی است که بزرگ‌ترین مدل را دارد، بلکه در دست کسی است که بهینه‌ترین مدل را در شبکه خود جای‌گذاری کرده است. این تحول، این فرض قدیمی را که AI با عملکرد بالا حتماً نیاز به اتصال ابری دارد، می‌شکند. برای به‌کارگیری این مفاهیم، متخصصان امنیتی باید بررسی کنند که کجا یک SLM می‌تواند جایگزین LLM ابری شود تا حریم خصوصی و سرعت افزایش یابد.

گام بعدی شما

جریان‌های کاری فعلی هوش مصنوعی خود را بررسی کنید تا نقاطی را که یک SLM می‌تواند جایگزین LLM ابری شود (برای حریم خصوصی و سرعت بیشتر) شناسایی کنید.
بررسی کنید آیا از قالب‌های استاندارد پرامپت برای یکسان‌سازی خروجی‌های تیم تحلیل خود استفاده می‌کنید یا خیر.
مدل‌های کوچک‌تر مانند Phi-3 یا Gemma را در محیط‌های ایزوله تست کنید تا تأثیر کوانتایزاسیون بر دقت شناسایی بدافزارها در شبکه خود را بسنجید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مقایسه انواع هوش مصنوعی و روش‌های مورد استفاده در امنیت سایبری