اگر امروز برای ابزارهای امنیتی هزینه میکنید، باید بدانید دقت استنتاج در شناسایی حفرههای امنیتی بدون نیاز به تولید متنهای طولانی ممکن شده است. مدل جدید GPT-5.6 Sol برای رسیدن به نتایج رقابتی در محک ExploitBench، تنها یکسوم توکنهای خروجی مدل Mythos Preview را مصرف میکند. این بهرهوری نشاندهنده تغییری بنیادین در نحوه برخورد مدلهای پیشرو با وظایف امنیتی بلندمدت است؛ تغییری که در آن تمرکز از تولید حجم بالای متن به سمت دقت بالا و استدلال متراکم منتقل شده است.
این جهش ابزاری در زمانی رخ میدهد که فشارها بر ایمنی هوش مصنوعی و امنیت ملی به اوج رسیده است. همانطور که در تحلیل قبلی ما دربارهی محدودیتهای دولت آمریکا بر عرضه مدلهای پیشرو اشاره کردیم، اوپنایآی اکنون در حال اجرای یک استراتژی عرضه هماهنگ است. آنها سعی دارند دسترسی گسترده توسعهدهندگان را با چکهای امنیتی اجباری دولت متوازن کنند تا از سوءاستفاده از قابلیتهای سایبری سطح بالا جلوگیری شود.
طبق اعلام شرکت، از ۲۶ ژوئن ۲۰۲۶، پیشنمایش محدودی برای گروه کوچکی از شرکای مورد اعتماد ارائه شده است. اوپنایآی در اطلاعیه خود تأکید کرد که نمیخواهد نظارت دولتی به یک پیشفرض بلندمدت تبدیل شود، اما این گام کوتاهمدت را برای تثبیت فرآیند تکرارپذیری عرضه مدلهای آینده تحت چارچوب فرمان اجرایی سایبری پذیرفته است. به باور این شرکت، محروم کردن توسعهدهندگان، کاربران، مدافعان سایبری و سازمانها از بهترین ابزارها در بلندمدت زیانبار است، اما این مدل عرضه مرحلهای، محکمترین مسیر برای دسترسی گستردهتر در هفتههای آینده است. لیست شرکای شرکتکننده در این مرحله به عنوان بخشی از تعامل جاری با دولت به اشتراک گذاشته شده است.
سلسلهمراتب مدلهای GPT-5.6
اوپنایآی نامگذاریهای خود را بازطراحی کرد تا کاربر بتواند بین هوشمندی، سرعت و هزینه راحتتر انتخاب کند. در این سیستم، عدد نشاندهنده نسل مدل است، در حالی که نامها نشاندهنده سطوح توانایی هستند که میتوانند با آهنگ و سرعت مستقل خود پیشرفت کنند:
- Sol: مدل پرچمدار با بالاترین سطح هوشمندی که برای عمیقترین استدلالها طراحی شده است. این مدل با قدرتمندترین پشته امنیتی تا به امروز عرضه شده است.
- Terra: مدلی متوازن برای بهرهوری روزمره؛ این مدل عملکرد GPT-5.5 را ارائه میدهد در حالی که ۲ برابر ارزانتر است.
- Luna: سریعترین و اقتصادیترین گزینه در این مجموعه که قابلیتهای قدرتمندی را با کمترین هزینه فراهم میکند.

سازوکارهای جدید استدلال
مدل GPT-5.6 Sol دو حالت عملیاتی حیاتی را برای مدیریت کارهای پیچیده معرفی کرده است:
- حداکثر تلاش برای استدلال (Max Reasoning Effort): تنظیماتی جدید که به Sol بیشترین زمان ممکن را میدهد تا پیش از ارائه پاسخ نهایی، استدلالی عمیق انجام دهد.
- حالت اولترا (Ultra Mode): قابلیتی که از سطح یک عامل واحد فراتر میرود و با بهرهگیری از زیر-عاملها (sub-agents) کارهای پیچیده را تسریع میکند.
این ابزارها باعث شدند مدل در محک Terminal-Bench 2.1 رکورد جدیدی بزند. این بنچمارک بهطور خاص گردشهای کاری در خط فرمان (command-line workflows) را میسنجد که نیازمند برنامهریزی، تکرار و هماهنگی ابزاری هستند.
در حوزه زیستشناسی نیز Sol در GeneBench v1 از GPT-5.5 پیشی گرفت. این ارزیابی بر تحلیلهای ژنومیک بلندمدت و تحلیلهای کمی زیستشناسی متمرکز است. Sol نتایج قویتری نسبت به نسل قبلی خود به دست آورد، در حالی که بهطور همزمان توکنهای کمتری مصرف کرد.
مرزهای امنیت سایبری
اوپنایآی مدل Sol را توانمندترین مدل خود برای امنیت سایبری معرفی کرد. این مدل بهویژه مرز بهرهوری-عملکرد را برای وظایف بلندمدت، از جمله تحقیق روی آسیبپذیریها و اکسپلویتها، جابهجا کرده است.
بر اساس گزارشهای محک ExploitGym — بنچمارکی که توسط پژوهشگران دانشگاه برکلی در همکاری با اوپنایآی و دیگر آزمایشگاههای پیشرو ایجاد شده — هر سه مدل سری ۵.۶ (Sol, Terra, Luna) با افزایش توان استدلال، بهبودهای چشمگیری در قابلیتهای سایبری نشان دادند. ذکر شده است که ExploitGym روی یک API آلفا با خروجی سریعتر اجرا شده، اما نتایج برای سازگاری با API عمومی بازتنظیم شدند.
با این حال، Sol هنوز پایینتر از آستانه «سایبری بحرانی» در چارچوب آمادگی (Preparedness Framework) اوپنایآی قرار دارد. در تستهای مربوط به کرومیوم و فایرفاکس، مدل توانست باگها و «ابزارهای اولیه اکسپلویت» (exploitation primitives یا بلوکهای سازنده یک اکسپلویت) را شناسایی کند، اما نتوانست بهصورت خودکار یک اکسپلویت کامل و کاربردی (full-chain exploit) تحت شرایط تست تولید کند.

لایههای حفاظتی چندگانه
اوپنایآی تأکید میکند که هیچ حفاظ تکلایه در برابر سوءاستفادههای تطبیقی کافی نیست. برای جلوگیری از فعالیتهای تهاجمی، آنها سیستمی با لایههای حفاظتی متعددی مستقر کردهاند که پیکربندی هر لایه با قابلیتهای هر مدل مطابقت دارد:
- آموزش در سطح مدل: مدل آموزش دیده تا درخواستهای ممنوعه سایبری را رد کند. این شامل حفاظت در برابر کاربرانی است که سعی میکنند قصد خود را پنهان کنند یا از روشهای جیلبریک استفاده نمایند.
- طبقهبندهای آنی (Real-Time Classifiers): طبقهبندهای سوءاستفاده از زیستشناسی و سایبری، خروجیها را در حین تولید رصد میکنند. اگر در موارد پرریسک نقض احتمالی شناسایی شود، تولید متن متوقف میشود تا یک مدل استدلالی بزرگتر، بستر گفتگو و زمینه را بررسی کند. در نهایت، خروجیهای غیرمجاز از کاربر withholding (پنهان) میشوند.
- نظارت در سطح حساب: سیستمها الگوهای موجود در چندین گفتگو و سیگنالهای ریسک را تحلیل میکنند. این امر به سیستم کمک میکند تا رفتارهای مخرب مستمر را از کارهای امنیتی قانونی (که در آنها مفاهیم فنی مشابه برای اهداف متفاوت استفاده میشوند) تشخیص دهد.
- دسترسی تفکیکشده: این رویکرد باعث میشود کارهای دفاعی حیاتی حفظ شوند، بدون اینکه حساسترین قابلیتها بهطور پیشفرض در دسترس همه قرار گیرند.
اوپنایآی چندین هفته را صرف یافتن نقاط ضعف و تست فشار سیستم در برابر حملات واقعی کرد. برای مقاومسازی مدلها، آنها بیش از ۷۰۰ هزار ساعت پردازشی معادل GPU A100 را به تیم قرمز (Red Teaming) خودکار اختصاص دادند. تمرکز این تلاش روی «جیلبریکهای جهانی» بود — یعنی حملاتی که در بسیاری از پرومپتها عمل میکنند و نه فقط در تنظیمات محدود — که به آنها اجازه داد الگوهای شکست را سریعتر از تستهای انسانی شناسایی کنند.
این فرآیند خودکار با تستهای انسانی متخصصان ثالث تکمیل میشود. از آنجا که هیچ ارزیابی نمیتواند تمام حملات چندمرحلهای را پوشش دهد، اوپنایآی یک فرآیند پاسخ سریع برای بازتولید، ارزیابی و رفع جیلبریکهای جدید دارد تا آنها را دوباره به ارزیابیها اضافه کرده و از تکرار شکستهای مشابه در آینده جلوگیری کند.
کاربرد قانونی در برابر سوءاستفاده
هدف اوپنایآی سختتر کردن فعالیتهای تهاجمی ممنوعه و در عین حال حفظ دسترسی برای کاربردهای مفید است. کارهای قانونی شامل موارد زیر است:
- بررسی کد و دیباگینگ
- تحقیق روی آسیبپذیریها و توسعه وصلههای امنیتی (Patch Development)
- آموزش امنیت
- تستهای دفاعی
اوپنایآی انتظار دارد مزایای قابل توجهی برای کارهای دفاعی قانونی ایجاد کند در حالی که بهطور معناداری استفادههای تهاجمی ممنوعه را محدود کند. مدل Sol بهطور صریح به گونهای توصیف شده که در کمک به یافتن و رفع آسیبپذیریها، بسیار توانمندتر از اجرای قابل اعتماد حملات سرتاسری (end-to-end) است. اولویت این است که این ابزارها ابتدا به دست مدافعان برسد تا آنها بتوانند سیستمها را تقویت کرده و وصلهها را توسعه دهند.
در طول دوره پیشنمایش، کاربران ممکن است متوجه شوند برخی درخواستها مسدود شده یا زمان بیشتری میبرند، زیرا برای بررسیهای تکمیلی متوقف شدهاند. اوپنایآی پذیرفته که حفاظها ممکن است گاهی در کارهای قانونی تداخل ایجاد کنند، بهویژه در حوزههای «دو منظوره» (dual-use) که اقدامات دفاعی و تهاجمی مشابه به نظر میرسند. بازخوردهای این پیشنمایش برای کاهش مسدودسازیهای غیرضروری، بهبود تفسیر بستر متن توسط حفاظها و ایجاد تجربهای روانتر پیش از عرضه گسترده استفاده خواهد شد.
برای مشتریان سازمانی، رویکردهای بلندمدتتری در حال توسعه است که شامل موارد زیر میشود:
- مکانیسمهای شناسایی با حفظ حریم خصوصی
- کنترلهای امنیتی تحت مدیریت مشتری
- دسترسی کالیبره شده بر اساس ریسک خاص مشتری، کاربر یا حجم کاری
قیمتگذاری و دسترسی API
سری GPT-5.6 سیستم پیشبینیپذیرتری برای حافظه موقت (Prompt Caching) معرفی کرده است، شامل پشتیبانی از نقاط شکست صریح حافظه (cache breakpoints) و حداقل عمر حافظه ۳۰ دقیقهای. نوشتن در حافظه با نرخ ۱.۲۵ برابر نرخ ورودی بدون کش محاسبه میشود، در حالی که خواندن از حافظه همچنان از تخفیف ۹۰ درصدی بهرهمند است.
نرخ قیمتگذاری برای هر ۱ میلیون توکن به شرح زیر است:
- Sol: ورودی ۵ دلار / خروجی ۳۰ دلار
- Terra: ورودی ۲.۵۰ دلار / خروجی ۱۵ دلار
- Luna: ورودی ۱ دلار / خروجی ۶ دلار
در دوره پیشنمایش، این مدلها از طریق API و Codex در دسترس هستند. در ماه جولای، مدل GPT-5.6 Sol روی پلتفرم Cerebras عرضه خواهد شد که سرعتهایی تا ۷۵۰ توکن در ثانیه را برای مشتریان منتخب با گسترش ظرفیت فراهم میکند.
این تغییر به سیستم Sol/Terra/Luna نشان میدهد که اوپنایآی از نسخهبندیهای یکپارچه و تکسنگی (monolithic) فاصله گرفته است. با جداسازی نسل (۵.۶) از سطوح توانایی، آنها اکنون میتوانند مدل Luna یا Terra را مستقل از مدل پرچمدار Sol ارتقا دهند.
برای کاربر نهایی، این یعنی «مالیات هوشمندی» در حال کاهش است. شما اکنون میتوانید مدلی را انتخاب کنید که ۵۰٪ ارزانتر است (Terra) بدون اینکه کیفیت نسل قبل را از دست بدهید. اما برد واقعی در قابلیتهای عاملمحور است؛ تغییر به سمت ارکستراسیون زیر-عاملها در حالت Ultra نشان میدهد که ما از چتباتها به سمت مهندسان نرمافزار خودکار حرکت میکنیم.
منتظر عرضه عمومی در هفتههای آینده باشید، زیرا میزان همکاری اوپنایآی با دولت آمریکا تعیین خواهد کرد که دقیقاً کدام حفاظهای امنیتی برای عموم فعال باقی میمانند.
گام بعدی شما
- اگر توسعهدهنده ابزارهای امنیتی هستید، برای تست مدل Terra روی کارهای تکراری برنامهریزی کنید تا هزینه استنتاج را کاهش دهید.
- قابلیت Ultra Mode را برای تسریع گردشهای کاری چندمرحلهای در API بررسی کنید.
- استراتژی جدید نامگذاری اوپنایآی را در معماری سیستمهای خود جایگذاری نمایید تا ارتقای مستقل مدلها را مدیریت کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است — به تحلیل ما درباره تراشههای Blackwell مراجعه کنید.




گفتگو