اگر با اسناد حساس سر و کار دارید، بزرگترین ریسک شما نشت اطلاعات در لحظهی پاکسازی یا همان Redaction است. PII GUI که در ۱۸ ژوئن ۲۰۲۶ منتشر شد، با نگه داشتن تمام محتوا در ماشین محلی شما، نیاز به اعتماد به ارائهدهندگان ابری را بهطور کامل حذف میکند.
بسیاری از ابزارهای فعلی یا بر اساس هایلایتهای دستیِ خطاپذیر کار میکنند یا دادهها را به یک API راه دور میفرستند. PII GUI این الگو را با معماری Local-first تغییر داده است؛ این برنامه از ترکیب Tauri 2، رابط کاربری React 19 و هستهی Rust استفاده میکند تا پردازش متن با سرعت بالا و بدون دسترسی به شبکه انجام شود.

همانطور که در تحلیلهای قبلی ما دربارهی امنیت مدلهای محلی اشاره کردیم، حذف واسطههای ابری تنها راه دستیابی به حریم خصوصی واقعی است. طبق مستندات این پروژه در گیتهاب، این ابزار از سه موتور شناسایی استفاده میکند:
- Regex (داخلی): شناسایی فوری ایمیلها، شماره تلفنها و URLها.
- OpenAI Privacy Filter: بهینهشده برای اسناد طولانی انگلیسی و دستهبندیهای گستردهی حریم خصوصی.
- BardsAI EU PII: تنظیمشده برای زبانهای اروپایی و آدرسهای محلی.
این برنامه برای پردازش PDFها از pdf.js استفاده میکند تا جایگاه دقیق نویسهها حفظ شود. کاربر میتواند پیش از خروجی نهایی، موارد شناساییشده را در یک محیط کاری بررسی و تایید کند. در مرحلهی نهایی، ابزار با استفاده از pdf-lib مستطیلهای مات و غیرقابلبرگشت را روی متن میکشد تا اطلاعات بهطور کامل حذف شوند.


این رویکرد باعث میشود تضاد بین «حریم خصوصی» و «کارایی» در پاکسازی دادههای مقیاسکوچک از بین برود. برای کاربر، یک کار دستی پرریسک به یک گردشکار محلی و قابلتأیید تبدیل شده است که در آن تنها درخواست شبکه، دانلود یکبارهی مدل از Hugging Face است.
گام بعدی شما
- اگر با دادههای حساس سازمانی کار میکنید، نسخهی متناسب با سیستمعامل خود را از GitHub Releases دانلود کنید.
- در هنگام راهاندازی، بسته به زبان اسناد خود، بین مدلهای OpenAI یا BardsAI یکی را انتخاب کنید.
- برای اطمینان از حذف کامل، خروجی PDF را با یک ویرایشگر متنی باز کنید تا از عدم وجود متن زیر لایههای سیاه مطمئن شوید.
اما داستان سختافزاری اجرای این مدلها روی سیستمهای ضعیف حتی جذابتر است — به بررسی ما دربارهی کوانتش مدلها مراجعه کنید.




گفتگو