باید بدانید که برای حفظ حاکمیت دادهها در حساسترین پروندههای دولتی، دیگر نیازی به ارسال اطلاعات به ابرهای خارجی نیست. تصور کنید یک مدل کوچک که روی سختافزارهای معمولی اجرا میشود، بتواند با دقتی برابر با غولهای ابری، مرز بین اطلاعات عمومی و محرمانه را تشخیص دهد.
طبق اعلام پژوهشگران در مطالعهای که در ۱۲ مه ۲۰۲۶ در arxiv.org منتشر شد، مدل Qwen3.5 9B قادر است محتوای مربوط به «امتیاز فرآیند مشورتی» (Deliberative Process Privilege) را بدون ریسکهای حقوقی و سیاسی ناشی از ارسال دادهها به APIهای ابری، شناسایی کند.
همانطور که در تحلیلهای پیشین ما دربارهی امنیت مدلهای بازمتن اشاره کردیم، کنترل کامل بر وزنهای مدل، تنها راه تضمین عدم نشت دادهها در سازمانهای حساس است. قوانین شفافیت دولتی، مانند قوانین FOIA در آمریکا و انگلیس، ایجاب میکند که پیش از انتشار عمومی، اطلاعات حساس حذف شوند. در حالی که مدلهای ابری عملکرد بالایی دارند، اما برای اسناد تأییدنشده، استفاده از آنها غیرممکن است و این موضوع نیاز به استنتاج (Inference) محلی و امن را دوچندان میکند.
به نقل از مستندات این پژوهش، محققان هشت مدل مختلف را برای طبقهبندی جملات ارزیابی کردند. یافتهها نشان داد که ترکیب خاصی از زنجیره تفکر (Chain-of-Thought) و پرامپتهای چند-نمونهای (Few-shot) — بهویژه با استفاده از نمونههای مبتنی بر خطا — باعث بیشینه شدن نرخ فراخوانی (Recall) و نمره F2 میشود.
جزئیات فنی کلیدی عبارتند از:
- مدل Qwen3.5 9B روی سختافزارهای مصرفکننده قابل استقرار است و نیاز به زیرساختهای گرانقیمت را حذف میکند.
- عملکرد این مدل به شدت به Gemini 2.5 Flash نزدیک شده است.
- زبانهای مشورتی را میتوان با شناسایی ضمایر اولشخص در ترکیب با افعالی که بیانگر عقیده هستند، با دقت بیشتری تشخیص داد.
این نتیجه، این پیشفرض را که طبقهبندیهای حقوقی حساس نیازمند مدلهای مقیاس-فرانتیر (Frontier-scale) هستند، میشکند. در واقع، استراتژی «مدل کوچک، پرامپت هوشمند» بر مقیاسبندی خام پارامترها پیروز شده است.
گام بعدی شما
- ساختارهای پرامپت چند-نمونهای مبتنی بر خطا را در مقاله اصلی arxiv بررسی کنید.
- برای وظایف طبقهبندی تخصصی، مدلهای ۹ میلیارد پارامتری را جایگزین مدلهای ابری کنید تا حاکمیت دادهها تضمین شود.
- ادغام خطلولههای طبقهبندی محلی در گردشکارهای رسمی حذف اطلاعات را رصد کنید.
اما چالش اصلی، انتقال این دقت از محیط آزمایشگاهی به عملیات واقعی است — به بررسی ما دربارهی بهینهسازی استنتاج در لبه مراجعه کنید.




گفتگو