چرا برای طبقه‌بندی اسناد محرمانه، مدل‌های غول‌پیکر دیگر ضروری نیستند؟

باید بدانید که برای حفظ حاکمیت داده‌ها در حساس‌ترین پرونده‌های دولتی، دیگر نیازی به ارسال اطلاعات به ابرهای خارجی نیست. تصور کنید یک مدل کوچک که روی سخت‌افزارهای معمولی اجرا می‌شود، بتواند با دقتی برابر با غول‌های ابری، مرز بین اطلاعات عمومی و محرمانه را تشخیص دهد.

طبق اعلام پژوهشگران در مطالعه‌ای که در ۱۲ مه ۲۰۲۶ در arxiv.org منتشر شد، مدل Qwen3.5 9B قادر است محتوای مربوط به «امتیاز فرآیند مشورتی» (Deliberative Process Privilege) را بدون ریسک‌های حقوقی و سیاسی ناشی از ارسال داده‌ها به APIهای ابری، شناسایی کند.

همان‌طور که در تحلیل‌های پیشین ما درباره‌ی امنیت مدل‌های بازمتن اشاره کردیم، کنترل کامل بر وزن‌های مدل، تنها راه تضمین عدم نشت داده‌ها در سازمان‌های حساس است. قوانین شفافیت دولتی، مانند قوانین FOIA در آمریکا و انگلیس، ایجاب می‌کند که پیش از انتشار عمومی، اطلاعات حساس حذف شوند. در حالی که مدل‌های ابری عملکرد بالایی دارند، اما برای اسناد تأییدنشده، استفاده از آن‌ها غیرممکن است و این موضوع نیاز به استنتاج (Inference) محلی و امن را دوچندان می‌کند.

به نقل از مستندات این پژوهش، محققان هشت مدل مختلف را برای طبقه‌بندی جملات ارزیابی کردند. یافته‌ها نشان داد که ترکیب خاصی از زنجیره تفکر (Chain-of-Thought) و پرامپت‌های چند-نمونه‌ای (Few-shot) — به‌ویژه با استفاده از نمونه‌های مبتنی بر خطا — باعث بیشینه شدن نرخ فراخوانی (Recall) و نمره F2 می‌شود.

جزئیات فنی کلیدی عبارتند از:

مدل Qwen3.5 9B روی سخت‌افزارهای مصرف‌کننده قابل استقرار است و نیاز به زیرساخت‌های گران‌قیمت را حذف می‌کند.
عملکرد این مدل به شدت به Gemini 2.5 Flash نزدیک شده است.
زبان‌های مشورتی را می‌توان با شناسایی ضمایر اول‌شخص در ترکیب با افعالی که بیانگر عقیده هستند، با دقت بیشتری تشخیص داد.

این نتیجه، این پیش‌فرض را که طبقه‌بندی‌های حقوقی حساس نیازمند مدل‌های مقیاس-فرانتیر (Frontier-scale) هستند، می‌شکند. در واقع، استراتژی «مدل کوچک، پرامپت هوشمند» بر مقیاس‌بندی خام پارامترها پیروز شده است.

گام بعدی شما

ساختارهای پرامپت چند-نمونه‌ای مبتنی بر خطا را در مقاله اصلی arxiv بررسی کنید.
برای وظایف طبقه‌بندی تخصصی، مدل‌های ۹ میلیارد پارامتری را جایگزین مدل‌های ابری کنید تا حاکمیت داده‌ها تضمین شود.
ادغام خط‌لوله‌های طبقه‌بندی محلی در گردش‌کارهای رسمی حذف اطلاعات را رصد کنید.

اما چالش اصلی، انتقال این دقت از محیط آزمایشگاهی به عملیات واقعی است — به بررسی ما درباره‌ی بهینه‌سازی استنتاج در لبه مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

جزئیات فنی کلیدی عبارتند از:

مدل Qwen3.5 9B روی سخت‌افزارهای مصرف‌کننده قابل استقرار است و نیاز به زیرساخت‌های گران‌قیمت را حذف می‌کند.
عملکرد این مدل به شدت به Gemini 2.5 Flash نزدیک شده است.
زبان‌های مشورتی را می‌توان با شناسایی ضمایر اول‌شخص در ترکیب با افعالی که بیانگر عقیده هستند، با دقت بیشتری تشخیص داد.

گام بعدی شما

ساختارهای پرامپت چند-نمونه‌ای مبتنی بر خطا را در مقاله اصلی arxiv بررسی کنید.
برای وظایف طبقه‌بندی تخصصی، مدل‌های ۹ میلیارد پارامتری را جایگزین مدل‌های ابری کنید تا حاکمیت داده‌ها تضمین شود.
ادغام خط‌لوله‌های طبقه‌بندی محلی در گردش‌کارهای رسمی حذف اطلاعات را رصد کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا برای طبقه‌بندی اسناد محرمانه، مدل‌های غول‌پیکر دیگر ضروری نیستند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا برای طبقه‌بندی اسناد محرمانه، مدل‌های غول‌پیکر دیگر ضروری نیستند؟

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا برای طبقه‌بندی اسناد محرمانه، مدل‌های غول‌پیکر دیگر ضروری نیستند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

چرا برای طبقه‌بندی اسناد محرمانه، مدل‌های غول‌پیکر دیگر ضروری نیستند؟

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران