رمزگشایی از کانال استگانوگرافی در استنتاج LLM از طریق بذرهای PRNG

باید بدانید که خروجی‌های مدل‌های زبانی شما ممکن است حاوی پیام‌های مخفی باشند، در حالی که از نظر بصری هیچ تغییری در متن دیده نمی‌شود. تصور کنید یک مهاجم بتواند بدون تغییر دادن حتی یک پارامتر در مدل، اطلاعات حساس را از طریق «تصادف» خروجی‌ها به بیرون درز دهد.

بر اساس تحلیل فنی منتشر شده در arxiv.org در ۹ ژوئن ۲۰۲۶، یک آسیب‌پذیری بنیادی در پشته استنتاج (Inference Stack) مدل‌های زبانی بزرگ کشف شده است که امکان انتقال پیام‌های ۳۲ بیتی را از طریق استگانوگرافی (Steganography) فراهم می‌کند. این روش از ویژگی‌های ساختاری رمزگشایی قطعی و بذرهای تولیدکننده اعداد شبه‌تصادفی (PRNG seeds) بهره می‌برد.

همان‌طور که در تحلیل قبلی ما درباره‌ی حمله CFD اشاره کردیم، نقص در اثبات اصالت مصنوعات می‌تواند نرخ موفقیت جیل‌بریک‌ها را بالا ببرد؛ حالا این پژوهش جدید ثابت می‌کند که حتی «تصادفی بودن» خروجی مدل نیز می‌تواند برای ارتباطات covert یا پنهانی به سلاح تبدیل شود.

این سازوکار بر پایه نمونه‌برداری تبدیل معکوس (Inverse-transform sampling) عمل می‌کند که در آن PRNGها بازه‌های احتمالی توکن‌ها را بر اساس بذر (seed) تولید می‌کنند. بر اساس مستندات این پژوهش، آزمایش‌ها روی ۶ خانواده مدل و ۵ دامنه متنی نتایج زیر را نشان داده است:

وضعیت پرامپت شناخته‌شده: در صورت اشتراک پرامپت بین فرستنده و گیرنده، بازیابی بذر ۳۲ بیتی با دقت ۱۰۰٪ در کمتر از ۳۰۰ توکن و در زمان کمتر از ۳۵ ثانیه روی یک GPU انجام می‌شود.
وضعیت پرامپت ناشناخته: حتی زمانی که فقط متن تولید شده در دسترس است، بازیابی داده‌ها در بازه ۶۰۰ تا ۸۰۰ توکن، تقریباً کامل و در حدود ۱۲ ثانیه صورت می‌گیرد.

از دیدگاه فنی، این یافته این فرض را که «ناآگاهی از پرامپت» یک لایه امنیتی معتبر است، کاملاً رد می‌کند. اگر بذر (seed) به عنوان حامل پیام استفاده شود، پرامپت از یک کلید ضروری برای رمزگشایی به یک کاتالیزور اختیاری تبدیل می‌شود. این موضوع نقطه تمرکز نظارت بر LLMها را از مانیتورینگ پرامپت به حسابرسی وضعیت نمونه‌برداری (sampling state) منتقل می‌کند.

گام بعدی شما

بررسی کنید که آیا خطوط لوله استنتاج شما مقادیر seed را در پاسخ‌های API افشا می‌کنند یا خیر.
ارزیابی کنید که آیا کاربران نهایی اجازه دستکاری بذرهای تصادفی را در تنظیمات مدل دارند.
دنبال کنید که آیا لایه‌های دفاعی جدیدی برای جداسازی وضعیت PRNG از توالی توکن‌های مرئی توسعه داده می‌شوند یا خیر.

اما داستان سخت‌افزاری این تحولات حتی پیچیده‌تر است؛ برای درک چگونگی مدیریت حافظه در مقیاس‌های عظیم، به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

وضعیت پرامپت شناخته‌شده: در صورت اشتراک پرامپت بین فرستنده و گیرنده، بازیابی بذر ۳۲ بیتی با دقت ۱۰۰٪ در کمتر از ۳۰۰ توکن و در زمان کمتر از ۳۵ ثانیه روی یک GPU انجام می‌شود.
وضعیت پرامپت ناشناخته: حتی زمانی که فقط متن تولید شده در دسترس است، بازیابی داده‌ها در بازه ۶۰۰ تا ۸۰۰ توکن، تقریباً کامل و در حدود ۱۲ ثانیه صورت می‌گیرد.

گام بعدی شما

بررسی کنید که آیا خطوط لوله استنتاج شما مقادیر seed را در پاسخ‌های API افشا می‌کنند یا خیر.
ارزیابی کنید که آیا کاربران نهایی اجازه دستکاری بذرهای تصادفی را در تنظیمات مدل دارند.
دنبال کنید که آیا لایه‌های دفاعی جدیدی برای جداسازی وضعیت PRNG از توالی توکن‌های مرئی توسعه داده می‌شوند یا خیر.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رمزگشایی از کانال استگانوگرافی در استنتاج LLM از طریق بذرهای PRNG

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رمزگشایی از کانال استگانوگرافی در استنتاج LLM از طریق بذرهای PRNG

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رمزگشایی از کانال استگانوگرافی در استنتاج LLM از طریق بذرهای PRNG

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

رمزگشایی از کانال استگانوگرافی در استنتاج LLM از طریق بذرهای PRNG

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران