مدل Sol در برابر Mythos؛ برتری در استدلال‌های عامل‌محور و امنیت

اگر امروز برای ابزارهای امنیتی هزینه می‌کنید، باید بدانید دقت استنتاج در شناسایی حفره‌های امنیتی بدون نیاز به تولید متن‌های طولانی ممکن شده است. مدل جدید GPT-5.6 Sol برای رسیدن به نتایج رقابتی در محک ExploitBench، تنها یک‌سوم توکن‌های خروجی مدل Mythos Preview را مصرف می‌کند. این بهره‌وری نشان‌دهنده تغییری بنیادین در نحوه برخورد مدل‌های پیشرو با وظایف امنیتی بلندمدت است؛ تغییری که در آن تمرکز از تولید حجم بالای متن به سمت دقت بالا و استدلال متراکم منتقل شده است.

این جهش ابزاری در زمانی رخ می‌دهد که فشارها بر ایمنی هوش مصنوعی و امنیت ملی به اوج رسیده است. همان‌طور که در تحلیل قبلی ما درباره‌ی محدودیت‌های دولت آمریکا بر عرضه مدل‌های پیشرو اشاره کردیم، اوپن‌ای‌آی اکنون در حال اجرای یک استراتژی عرضه هماهنگ است. آن‌ها سعی دارند دسترسی گسترده توسعه‌دهندگان را با چک‌های امنیتی اجباری دولت متوازن کنند تا از سوءاستفاده از قابلیت‌های سایبری سطح بالا جلوگیری شود.

طبق اعلام شرکت، از ۲۶ ژوئن ۲۰۲۶، پیش‌نمایش محدودی برای گروه کوچکی از شرکای مورد اعتماد ارائه شده است. اوپن‌ای‌آی در اطلاعیه خود تأکید کرد که نمی‌خواهد نظارت دولتی به یک پیش‌فرض بلندمدت تبدیل شود، اما این گام کوتاه‌مدت را برای تثبیت فرآیند تکرارپذیری عرضه مدل‌های آینده تحت چارچوب فرمان اجرایی سایبری پذیرفته است. به باور این شرکت، محروم کردن توسعه‌دهندگان، کاربران، مدافعان سایبری و سازمان‌ها از بهترین ابزارها در بلندمدت زیان‌بار است، اما این مدل عرضه مرحله‌ای، محکم‌ترین مسیر برای دسترسی گسترده‌تر در هفته‌های آینده است. لیست شرکای شرکت‌کننده در این مرحله به عنوان بخشی از تعامل جاری با دولت به اشتراک گذاشته شده است.

سلسله‌مراتب مدل‌های GPT-5.6

اوپن‌ای‌آی نام‌گذاری‌های خود را بازطراحی کرد تا کاربر بتواند بین هوشمندی، سرعت و هزینه راحت‌تر انتخاب کند. در این سیستم، عدد نشان‌دهنده نسل مدل است، در حالی که نام‌ها نشان‌دهنده سطوح توانایی هستند که می‌توانند با آهنگ و سرعت مستقل خود پیشرفت کنند:

Sol: مدل پرچمدار با بالاترین سطح هوشمندی که برای عمیق‌ترین استدلال‌ها طراحی شده است. این مدل با قدرتمندترین پشته امنیتی تا به امروز عرضه شده است.
Terra: مدلی متوازن برای بهره‌وری روزمره؛ این مدل عملکرد GPT-5.5 را ارائه می‌دهد در حالی که ۲ برابر ارزان‌تر است.
Luna: سریع‌ترین و اقتصادی‌ترین گزینه در این مجموعه که قابلیت‌های قدرتمندی را با کمترین هزینه فراهم می‌کند.

پیش‌نمایش مدل نسل بعدی GPT-5.6 Sol: هوش مصنوعی پیشرفته با قابلیت‌های نوآورانه

سازوکارهای جدید استدلال

مدل GPT-5.6 Sol دو حالت عملیاتی حیاتی را برای مدیریت کارهای پیچیده معرفی کرده است:

حداکثر تلاش برای استدلال (Max Reasoning Effort): تنظیماتی جدید که به Sol بیشترین زمان ممکن را می‌دهد تا پیش از ارائه پاسخ نهایی، استدلالی عمیق انجام دهد.
حالت اولترا (Ultra Mode): قابلیتی که از سطح یک عامل واحد فراتر می‌رود و با بهره‌گیری از زیر-عامل‌ها (sub-agents) کارهای پیچیده را تسریع می‌کند.

این ابزارها باعث شدند مدل در محک Terminal-Bench 2.1 رکورد جدیدی بزند. این بنچمارک به‌طور خاص گردش‌های کاری در خط فرمان (command-line workflows) را می‌سنجد که نیازمند برنامه‌ریزی، تکرار و هماهنگی ابزاری هستند.

در حوزه زیست‌شناسی نیز Sol در GeneBench v1 از GPT-5.5 پیشی گرفت. این ارزیابی بر تحلیل‌های ژنومیک بلندمدت و تحلیل‌های کمی زیست‌شناسی متمرکز است. Sol نتایج قوی‌تری نسبت به نسل قبلی خود به دست آورد، در حالی که به‌طور همزمان توکن‌های کمتری مصرف کرد.

مرزهای امنیت سایبری

اوپن‌ای‌آی مدل Sol را توانمندترین مدل خود برای امنیت سایبری معرفی کرد. این مدل به‌ویژه مرز بهره‌وری-عملکرد را برای وظایف بلندمدت، از جمله تحقیق روی آسیب‌پذیری‌ها و اکسپلویت‌ها، جابه‌جا کرده است.

بر اساس گزارش‌های محک ExploitGym — بنچمارکی که توسط پژوهشگران دانشگاه برکلی در همکاری با اوپن‌ای‌آی و دیگر آزمایشگاه‌های پیشرو ایجاد شده — هر سه مدل سری ۵.۶ (Sol, Terra, Luna) با افزایش توان استدلال، بهبودهای چشمگیری در قابلیت‌های سایبری نشان دادند. ذکر شده است که ExploitGym روی یک API آلفا با خروجی سریع‌تر اجرا شده، اما نتایج برای سازگاری با API عمومی بازتنظیم شدند.

با این حال، Sol هنوز پایین‌تر از آستانه «سایبری بحرانی» در چارچوب آمادگی (Preparedness Framework) اوپن‌ای‌آی قرار دارد. در تست‌های مربوط به کرومیوم و فایرفاکس، مدل توانست باگ‌ها و «ابزارهای اولیه اکسپلویت» (exploitation primitives یا بلوک‌های سازنده یک اکسپلویت) را شناسایی کند، اما نتوانست به‌صورت خودکار یک اکسپلویت کامل و کاربردی (full-chain exploit) تحت شرایط تست تولید کند.

پیش‌نمایش مدل نسل بعدی GPT-5.6 Sol

لایه‌های حفاظتی چندگانه

اوپن‌ای‌آی تأکید می‌کند که هیچ حفاظ تک‌لایه در برابر سوءاستفاده‌های تطبیقی کافی نیست. برای جلوگیری از فعالیت‌های تهاجمی، آن‌ها سیستمی با لایه‌های حفاظتی متعددی مستقر کرده‌اند که پیکربندی هر لایه با قابلیت‌های هر مدل مطابقت دارد:

آموزش در سطح مدل: مدل آموزش دیده تا درخواست‌های ممنوعه سایبری را رد کند. این شامل حفاظت در برابر کاربرانی است که سعی می‌کنند قصد خود را پنهان کنند یا از روش‌های جیل‌بریک استفاده نمایند.
طبقه‌بندهای آنی (Real-Time Classifiers): طبقه‌بندهای سوءاستفاده از زیست‌شناسی و سایبری، خروجی‌ها را در حین تولید رصد می‌کنند. اگر در موارد پرریسک نقض احتمالی شناسایی شود، تولید متن متوقف می‌شود تا یک مدل استدلالی بزرگ‌تر، بستر گفتگو و زمینه را بررسی کند. در نهایت، خروجی‌های غیرمجاز از کاربر withholding (پنهان) می‌شوند.
نظارت در سطح حساب: سیستم‌ها الگوهای موجود در چندین گفتگو و سیگنال‌های ریسک را تحلیل می‌کنند. این امر به سیستم کمک می‌کند تا رفتارهای مخرب مستمر را از کارهای امنیتی قانونی (که در آن‌ها مفاهیم فنی مشابه برای اهداف متفاوت استفاده می‌شوند) تشخیص دهد.
دسترسی تفکیک‌شده: این رویکرد باعث می‌شود کارهای دفاعی حیاتی حفظ شوند، بدون اینکه حساس‌ترین قابلیت‌ها به‌طور پیش‌فرض در دسترس همه قرار گیرند.

اوپن‌ای‌آی چندین هفته را صرف یافتن نقاط ضعف و تست فشار سیستم در برابر حملات واقعی کرد. برای مقاوم‌سازی مدل‌ها، آن‌ها بیش از ۷۰۰ هزار ساعت پردازشی معادل GPU A100 را به تیم قرمز (Red Teaming) خودکار اختصاص دادند. تمرکز این تلاش روی «جیل‌بریک‌های جهانی» بود — یعنی حملاتی که در بسیاری از پرومپت‌ها عمل می‌کنند و نه فقط در تنظیمات محدود — که به آن‌ها اجازه داد الگوهای شکست را سریع‌تر از تست‌های انسانی شناسایی کنند.

این فرآیند خودکار با تست‌های انسانی متخصصان ثالث تکمیل می‌شود. از آنجا که هیچ ارزیابی نمی‌تواند تمام حملات چندمرحله‌ای را پوشش دهد، اوپن‌ای‌آی یک فرآیند پاسخ سریع برای بازتولید، ارزیابی و رفع جیل‌بریک‌های جدید دارد تا آن‌ها را دوباره به ارزیابی‌ها اضافه کرده و از تکرار شکست‌های مشابه در آینده جلوگیری کند.

کاربرد قانونی در برابر سوءاستفاده

هدف اوپن‌ای‌آی سخت‌تر کردن فعالیت‌های تهاجمی ممنوعه و در عین حال حفظ دسترسی برای کاربردهای مفید است. کارهای قانونی شامل موارد زیر است:

بررسی کد و دیباگینگ
تحقیق روی آسیب‌پذیری‌ها و توسعه وصله‌های امنیتی (Patch Development)
آموزش امنیت
تست‌های دفاعی

اوپن‌ای‌آی انتظار دارد مزایای قابل توجهی برای کارهای دفاعی قانونی ایجاد کند در حالی که به‌طور معناداری استفاده‌های تهاجمی ممنوعه را محدود کند. مدل Sol به‌طور صریح به گونه‌ای توصیف شده که در کمک به یافتن و رفع آسیب‌پذیری‌ها، بسیار توانمندتر از اجرای قابل اعتماد حملات سرتاسری (end-to-end) است. اولویت این است که این ابزارها ابتدا به دست مدافعان برسد تا آن‌ها بتوانند سیستم‌ها را تقویت کرده و وصله‌ها را توسعه دهند.

در طول دوره پیش‌نمایش، کاربران ممکن است متوجه شوند برخی درخواست‌ها مسدود شده یا زمان بیشتری می‌برند، زیرا برای بررسی‌های تکمیلی متوقف شده‌اند. اوپن‌ای‌آی پذیرفته که حفاظ‌ها ممکن است گاهی در کارهای قانونی تداخل ایجاد کنند، به‌ویژه در حوزه‌های «دو منظوره» (dual-use) که اقدامات دفاعی و تهاجمی مشابه به نظر می‌رسند. بازخوردهای این پیش‌نمایش برای کاهش مسدودسازی‌های غیرضروری، بهبود تفسیر بستر متن توسط حفاظ‌ها و ایجاد تجربه‌ای روان‌تر پیش از عرضه گسترده استفاده خواهد شد.

برای مشتریان سازمانی، رویکردهای بلندمدت‌تری در حال توسعه است که شامل موارد زیر می‌شود:

مکانیسم‌های شناسایی با حفظ حریم خصوصی
کنترل‌های امنیتی تحت مدیریت مشتری
دسترسی کالیبره شده بر اساس ریسک خاص مشتری، کاربر یا حجم کاری

قیمت‌گذاری و دسترسی API

سری GPT-5.6 سیستم پیش‌بینی‌پذیرتری برای حافظه موقت (Prompt Caching) معرفی کرده است، شامل پشتیبانی از نقاط شکست صریح حافظه (cache breakpoints) و حداقل عمر حافظه ۳۰ دقیقه‌ای. نوشتن در حافظه با نرخ ۱.۲۵ برابر نرخ ورودی بدون کش محاسبه می‌شود، در حالی که خواندن از حافظه همچنان از تخفیف ۹۰ درصدی بهره‌مند است.

نرخ قیمت‌گذاری برای هر ۱ میلیون توکن به شرح زیر است:

Sol: ورودی ۵ دلار / خروجی ۳۰ دلار
Terra: ورودی ۲.۵۰ دلار / خروجی ۱۵ دلار
Luna: ورودی ۱ دلار / خروجی ۶ دلار

در دوره پیش‌نمایش، این مدل‌ها از طریق API و Codex در دسترس هستند. در ماه جولای، مدل GPT-5.6 Sol روی پلتفرم Cerebras عرضه خواهد شد که سرعت‌هایی تا ۷۵۰ توکن در ثانیه را برای مشتریان منتخب با گسترش ظرفیت فراهم می‌کند.

این تغییر به سیستم Sol/Terra/Luna نشان می‌دهد که اوپن‌ای‌آی از نسخه‌بندی‌های یکپارچه و تک‌سنگی (monolithic) فاصله گرفته است. با جداسازی نسل (۵.۶) از سطوح توانایی، آن‌ها اکنون می‌توانند مدل Luna یا Terra را مستقل از مدل پرچمدار Sol ارتقا دهند.

برای کاربر نهایی، این یعنی «مالیات هوشمندی» در حال کاهش است. شما اکنون می‌توانید مدلی را انتخاب کنید که ۵۰٪ ارزان‌تر است (Terra) بدون اینکه کیفیت نسل قبل را از دست بدهید. اما برد واقعی در قابلیت‌های عامل‌محور است؛ تغییر به سمت ارکستراسیون زیر-عامل‌ها در حالت Ultra نشان می‌دهد که ما از چت‌بات‌ها به سمت مهندسان نرم‌افزار خودکار حرکت می‌کنیم.

منتظر عرضه عمومی در هفته‌های آینده باشید، زیرا میزان همکاری اوپن‌ای‌آی با دولت آمریکا تعیین خواهد کرد که دقیقاً کدام حفاظ‌های امنیتی برای عموم فعال باقی می‌مانند.

گام بعدی شما

اگر توسعه‌دهنده ابزارهای امنیتی هستید، برای تست مدل Terra روی کارهای تکراری برنامه‌ریزی کنید تا هزینه استنتاج را کاهش دهید.
قابلیت Ultra Mode را برای تسریع گردش‌های کاری چندمرحله‌ای در API بررسی کنید.
استراتژی جدید نام‌گذاری اوپن‌ای‌آی را در معماری سیستم‌های خود جای‌گذاری نمایید تا ارتقای مستقل مدل‌ها را مدیریت کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

سلسله‌مراتب مدل‌های GPT-5.6

Sol: مدل پرچمدار با بالاترین سطح هوشمندی که برای عمیق‌ترین استدلال‌ها طراحی شده است. این مدل با قدرتمندترین پشته امنیتی تا به امروز عرضه شده است.
Terra: مدلی متوازن برای بهره‌وری روزمره؛ این مدل عملکرد GPT-5.5 را ارائه می‌دهد در حالی که ۲ برابر ارزان‌تر است.
Luna: سریع‌ترین و اقتصادی‌ترین گزینه در این مجموعه که قابلیت‌های قدرتمندی را با کمترین هزینه فراهم می‌کند.

پیش‌نمایش مدل نسل بعدی GPT-5.6 Sol: هوش مصنوعی پیشرفته با قابلیت‌های نوآورانه

سازوکارهای جدید استدلال

مدل GPT-5.6 Sol دو حالت عملیاتی حیاتی را برای مدیریت کارهای پیچیده معرفی کرده است:

حداکثر تلاش برای استدلال (Max Reasoning Effort): تنظیماتی جدید که به Sol بیشترین زمان ممکن را می‌دهد تا پیش از ارائه پاسخ نهایی، استدلالی عمیق انجام دهد.
حالت اولترا (Ultra Mode): قابلیتی که از سطح یک عامل واحد فراتر می‌رود و با بهره‌گیری از زیر-عامل‌ها (sub-agents) کارهای پیچیده را تسریع می‌کند.

مرزهای امنیت سایبری

پیش‌نمایش مدل نسل بعدی GPT-5.6 Sol

لایه‌های حفاظتی چندگانه

آموزش در سطح مدل: مدل آموزش دیده تا درخواست‌های ممنوعه سایبری را رد کند. این شامل حفاظت در برابر کاربرانی است که سعی می‌کنند قصد خود را پنهان کنند یا از روش‌های جیل‌بریک استفاده نمایند.
طبقه‌بندهای آنی (Real-Time Classifiers): طبقه‌بندهای سوءاستفاده از زیست‌شناسی و سایبری، خروجی‌ها را در حین تولید رصد می‌کنند. اگر در موارد پرریسک نقض احتمالی شناسایی شود، تولید متن متوقف می‌شود تا یک مدل استدلالی بزرگ‌تر، بستر گفتگو و زمینه را بررسی کند. در نهایت، خروجی‌های غیرمجاز از کاربر withholding (پنهان) می‌شوند.
نظارت در سطح حساب: سیستم‌ها الگوهای موجود در چندین گفتگو و سیگنال‌های ریسک را تحلیل می‌کنند. این امر به سیستم کمک می‌کند تا رفتارهای مخرب مستمر را از کارهای امنیتی قانونی (که در آن‌ها مفاهیم فنی مشابه برای اهداف متفاوت استفاده می‌شوند) تشخیص دهد.
دسترسی تفکیک‌شده: این رویکرد باعث می‌شود کارهای دفاعی حیاتی حفظ شوند، بدون اینکه حساس‌ترین قابلیت‌ها به‌طور پیش‌فرض در دسترس همه قرار گیرند.

کاربرد قانونی در برابر سوءاستفاده

بررسی کد و دیباگینگ
تحقیق روی آسیب‌پذیری‌ها و توسعه وصله‌های امنیتی (Patch Development)
آموزش امنیت
تست‌های دفاعی

برای مشتریان سازمانی، رویکردهای بلندمدت‌تری در حال توسعه است که شامل موارد زیر می‌شود:

مکانیسم‌های شناسایی با حفظ حریم خصوصی
کنترل‌های امنیتی تحت مدیریت مشتری
دسترسی کالیبره شده بر اساس ریسک خاص مشتری، کاربر یا حجم کاری

قیمت‌گذاری و دسترسی API

نرخ قیمت‌گذاری برای هر ۱ میلیون توکن به شرح زیر است:

Sol: ورودی ۵ دلار / خروجی ۳۰ دلار
Terra: ورودی ۲.۵۰ دلار / خروجی ۱۵ دلار
Luna: ورودی ۱ دلار / خروجی ۶ دلار

گام بعدی شما

اگر توسعه‌دهنده ابزارهای امنیتی هستید، برای تست مدل Terra روی کارهای تکراری برنامه‌ریزی کنید تا هزینه استنتاج را کاهش دهید.
قابلیت Ultra Mode را برای تسریع گردش‌های کاری چندمرحله‌ای در API بررسی کنید.
استراتژی جدید نام‌گذاری اوپن‌ای‌آی را در معماری سیستم‌های خود جای‌گذاری نمایید تا ارتقای مستقل مدل‌ها را مدیریت کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل Sol در برابر Mythos؛ برتری در استدلال‌های عامل‌محور و امنیت

سلسله‌مراتب مدل‌های GPT-5.6

سازوکارهای جدید استدلال

مرزهای امنیت سایبری

لایه‌های حفاظتی چندگانه

کاربرد قانونی در برابر سوءاستفاده

قیمت‌گذاری و دسترسی API

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل Sol در برابر Mythos؛ برتری در استدلال‌های عامل‌محور و امنیت

سلسله‌مراتب مدل‌های GPT-5.6

سازوکارهای جدید استدلال

مرزهای امنیت سایبری

لایه‌های حفاظتی چندگانه

کاربرد قانونی در برابر سوءاستفاده

قیمت‌گذاری و دسترسی API

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل Sol در برابر Mythos؛ برتری در استدلال‌های عامل‌محور و امنیت

سلسله‌مراتب مدل‌های GPT-5.6

سازوکارهای جدید استدلال

مرزهای امنیت سایبری

لایه‌های حفاظتی چندگانه

کاربرد قانونی در برابر سوءاستفاده

قیمت‌گذاری و دسترسی API

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل Sol در برابر Mythos؛ برتری در استدلال‌های عامل‌محور و امنیت

سلسله‌مراتب مدل‌های GPT-5.6

سازوکارهای جدید استدلال

مرزهای امنیت سایبری

لایه‌های حفاظتی چندگانه

کاربرد قانونی در برابر سوءاستفاده

قیمت‌گذاری و دسترسی API

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران