عاملهای پژوهشی شما ممکن است اسرار تجاری شرکت را درست از طریق همان جستوجوهایی که برای یافتن پاسخ به کار میبرند، فاش کنند. طبق تحلیل فنی منتشر شده در ۱۸ ژوئن ۲۰۲۶، این عاملها اغلب تکههایی از اسناد خصوصی را در کوئریهای ارسالی به وب جای میدهند و به ناظران اجازه میدهند دادههای حساس را از طریق «اثر موزائیکی» بازسازی کنند.
این ریسک زمانی رخ میدهد که یک عامل (Agent) برای فرمولبندی یک جستوجوی عمومی، ابتدا باید یک حقیقت محلی را بازیابی کند. برای مثال، در یک سناریوی بهداشتی، ممکن است عاملی برای تاریخ دقیق مهاجرت به ابر (Cloud Migration) که در یک فایل خصوصی یافته، جستوجو کند؛ در حالی که کوئری بهتنهایی عادی به نظر میرسد، مجموع این لاگها نقاط عطف زیرساختی یک شرکت را برای هر کسی که ترافیک را رصد میکند، فاش میکند.

به نقل از پژوهشگران، برای اندازهگیری این پدیده، بنچمارکی به نام MosaicLeaks شامل ۱۰۰۱ زنجیره پژوهشی چندگانه طراحی شد. آنها سه سطح ریسک را شناسایی کردند: نشت هدف (افشای مقصود)، نشت پاسخ (پاسخ به پرسشهای خصوصی) و نشت کامل اطلاعات (بیان ادعاهای محرمانه). آزمایشها روی مدل Qwen3-4B نشان داد که صرفاً از طریق مهندسی پرامپت (Prompt Engineering) و درخواست از مدل برای حفظ حریم خصوصی، نمیتوان جلوی نشت را گرفت و این کار حتی نرخ موفقیت عامل را کاهش داد.


همانطور که در تحلیلهای پیشین ما درباره امنیت مدلهای بازمتن اشاره کردیم، تضاد اصلی اینجاست که آموزش مدلها صرفاً برای ارتقای عملکرد، در واقع نشت دادهها را افزایش میدهد. بر اساس مستندات، وقتی مدل پایه Qwen3-4B فقط برای موفقیت در تکلیف آموزش دید، نرخ نشت از ۳۴.۰٪ به ۵۱.۷٪ رسید؛ زیرا مدل آموخت برای رسیدن به نتایج بهتر، بافتار خصوصی بیشتری را در کوئریها بگنجاند.
برای حل این معضل، تیم تحقیق متد پژوهش عمیق آگاه به حریم خصوصی (Privacy-Aware Deep Research یا PA-DR) را معرفی کرد. این روش ترکیبی از پاداشهای تکلیفمحور و یک پاداش حریم خصوصی است که توسط یک طبقهبندیکننده (Classifier) برای جریمه کردن کوئریهای افشاگر عمل میکند.


روش PA-DR موفق شد عملکرد را از حریم خصوصی تفکیک کند. این متد موفقیت زنجیرههای سختگیرانه را از ۴۸.۷٪ به ۵۸.۷٪ رساند و همزمان نشت پاسخ/اطلاعات کامل را به ۹.۹٪ کاهش داد. نکته کلیدی این است که این پاداشهای موقعیتی ۵ تا ۶ برابر کارآمدتر از یادگیری تقویتی (RL) استاندارد بر پایه نتیجه هستند و با نمونههای بسیار کمتری به عملکرد هدف میرسند.

این تغییر ثابت میکند که حریم خصوصی در جریانهای کاری عاملمحور را نمیتوان با پرامپت «اضافه» کرد، بلکه باید در فرآیند تصمیمگیری مدل نهادینه شود. مهندسان اکنون باید نهتنها پاسخ نهایی، بلکه هزینه حریم خصوصی در لاگهای کوئری تولید شده طی فرآیند پژوهش را ارزیابی کنند. این چالش در حالی رخ میدهد که موتورهای پژوهشی برای افزایش دقت، به شدت بر استناد به منابع متکی شدهاند؛ چنانکه پیشتر دیدیم چگونه تغییر در استراتژی ارجاعات در Perplexity منجر به بهبود چشمگیر کیفیت پاسخها و بازاریابی محتوایی شد، اما اکنون تمرکز بر این است که این استنادها منجر به افشای دادههای داخلی نشوند.
گام بعدی شما
- لاگهای کوئری عاملهای پژوهشی خود را با ابزارهای شناسایی دادههای حساس (PII) بررسی کنید.
- به جای اتکای صرف به پرامپتهای سیستمی برای حفظ حریم خصوصی، روی روشهای آموزش مبتنی بر پاداش (Reward-based) سرمایهگذاری کنید.
- بررسی کنید که آیا عاملهای شما در مراحل میانی پژوهش، دادههای داخلی را به عنوان بخشی از کوئری به موتورهای جستوجو ارسال میکنند یا خیر.
اما توسعه طبقهبندیکنندههای حریم خصوصی در زمان واقعی که بتوانند کوئریها را قبل از خروج از شبکه پاکسازی کنند، لبه جدید این رقابت است — در گزارشهای آتی به ابزارهای Sanitization خواهیم پرداخت.




گفتگو