اگر برای محافظت از پایگاههای داده خود تنها به همراستاسازی داخلی مدلهای زبانی تکیه کردهاید، در واقع درهای سیستم خود را به روی مهاجمان باز گذاشتهاید. باید بدانید که مدلهای زبانی، حتی پیشرفتهترین آنها، در برابر ورودیهای متخاصم (Adversarial Inputs) که هدفشان دور زدن فیلترهاست، آسیبپذیرند.
با گسترش رابطهای گفتگو برای دسترسی به دادههای ساختاریافته، سطح حملات تزریق SQL (SQL Injection) افزایش یافته است. همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، مرز بین ورودی کاربر و دستورات سیستمی در مدلهای زبانی بسیار شکننده است و این موضوع تبدیل زبان طبیعی به SQL را به یک نقطه ضعف امنیتی تبدیل میکند.
طبق اعلام پژوهشگر فرزاد نورمحمدزاده مطلق در مقالهای که ۱۲ می ۲۰۲۶ در arxiv.org منتشر شد، برای رفع این نقص باید از یک چارچوب امنیتی سهلایه استفاده کرد:
- لایه پاکسازی پرامپت (Prompt Sanitization): یک سپر امنیتی در ورودی برای حذف کاراکترها و الگوهای مشکوک.
- مدل تشخیص تهدید پیشرفته: شناسایی ناهنجاریهای رفتاری و بردار معنایی (Semantic Anomaly Detection) برای تشخیص قصد مخرب کاربر.
- لایه کنترل مبتنی بر امضا (Signature-based Control): مسدود کردن الگوهای شناختهشدهی حملات SQL.
به نقل از مستندات این پژوهش، تیم سازنده برای اعتبارسنجی سیستم، یک مجموعه داده بنچمارک جامع از پرامپتهای متخاصم ایجاد کردند. نتایج نشان میدهد که این سیستم در برابر حملات پیچیده و دستکاریهای متنی، نرخ دقت بسیار بالا و میزان خطای مثبت کاذب (False-positive) اندکی دارد.
این پژوهش فرضیه رایج مبنی بر کفایت آموزشهای ایمنی (Safety Training) را رد میکند. برای متخصصان فنی، این بدان معناست که خط لوله تبدیل متن به SQL باید به عنوان یک مرز غیرقابلاعتماد (Untrusted Boundary) تلقی شود و به جای یک فیلتر ساده، استراتژی «دفاع در عمق» (Defense-in-Depth) را اتخاذ کند.
گام بعدی شما
- بررسی مجموعه دادههای بنچمارک این مطالعه برای تست نفوذ در رابطهای دیتابیس خود.
- پیادهسازی لایهی میانی (Middleware) امنیتی پیش از ارسال پرامپت به مدل.
- جایگزینی فیلترهای متنی ساده با مدلهای تشخیص ناهنجاری معنایی.
اما چالش بعدی، مقابله با حملات پیچیدهتر در مدلهای چندوجهی است — در گزارش بعدی به بررسی امنیت مدلهای Vision-to-SQL خواهیم پرداخت.




گفتگو