آنتروپیک علیه علی‌بابا: استخراج صنعتی قابلیت‌های مدل کلود از طریق API

منبع خبر

۲۳ دقیقه پیش·۴ تیر ۱۴۰۵۲۶ دقیقه مطالعه

آنتروپیک: علی‌بابا قابلیت‌های مدل کلود را به‌طور غیرقانونی استخراج کرد؛ بزرگ‌ترین حمله تقطیر شناخته‌شده

اشتراک‌گذاری

تصور کنید هزینه‌ی آموزش یک مدل هوش مصنوعی پیشرو ۱۰۰ میلیون دلار باشد، اما رقیب شما بتواند تنها با پرداخت چند صد هزار دلار، تمام تخصص و رفتارهای آن را به مدل خودش منتقل کند. این کابوس امروز برای شرکت آنتروپیک (Anthropic) به واقعیت تبدیل شده است. در ۲۴ ژوئن ۲۰۲۶، آنتروپیک گروه علی‌بابا (Alibaba) را متهم کرد که قابلیت‌های مدل Claude را از طریق آنچه بزرگ‌ترین «حمله تقطیری» (Distillation Attack) در تاریخ شرکت می‌نامند، به‌صورت غیرقانونی استخراج کرده است.

این تقابل در زمانی حساس برای آزمایشگاه‌های هوش مصنوعی غربی رخ می‌دهد. در حالی که شرکت‌هایی مانند آنتروپیک، OpenAI و گوگل از طریق APIهای خود مدل‌های پیشرو را تجاری‌سازی می‌کنند، همزمان یک سطح حمله (Attack Surface) گسترده را برای رقبا ایجاد کرده‌اند. اگر به پوشش‌های قبلی ما درباره نحوه استفاده توسعه‌دهندگان از این ابزارها برای وظایف با عملکرد بالا نگاه کنیم — برای مثال، چگونه PostHog با استفاده از Claude Code سرعت تجزیه کننده SQL خود را افزایش داد — متوجه می‌شویم که این رویداد وجه تاریک این دسترسی‌پذیری است: همان API که بهره‌وری را ممکن می‌سازد، سرقت فناوری را نیز تسهیل می‌کند.

پارادوکس استخراج API باز

برای درک عمیق این کشمکش، باید از دریچه «پارادوکس استخراج API باز» به موضوع نگاه کرد. این چارچوب توصیف‌کننده‌ی یک تضاد ذاتی است؛ آزمایشگاه‌های هوش مصنوعی برای تولید درآمد مجبورند مدل‌های خود را باز کنند، اما همین باز بودن به بازیگران متخاصم اجازه می‌دهد تا قابلیت‌های پیشرو را با هزینه‌ای نزدیک به صفر مهندسی معکوس کنند.

این پارادوکس در چهار سطح مختلف عمل می‌کند: فنی، حقوقی، ژئوپلیتیکی و مالی. تنش بنیادین در این است که API هم موتور درآمدزایی است و هم سطح حمله. در نتیجه، هرچه یک مدل توانمندتر و سودآورتر شود، استخراج آن برای رقیب از نظر اقتصادی منطقی‌تر خواهد بود.

این وضعیت را با این مثال تصور کنید: شما بهترین رستوران شهر را اداره می‌کنید، اما رقیب شما هر شب مامورانی می‌فرستد تا تمام غذاها را بچشند و دستور پخت آن‌ها را بازسازی کنند. آن‌ها کتاب‌های آشپزی شما را نمی‌دزدند؛ بلکه فقط خروجی‌های شما را مشاهده می‌کنند تا زمانی که بتوانند آشپزخانه شما را بازسازی کنند. این دقیقاً ماهیت یک حمله تقطیری است.

مکانیسم‌های حمله

کمپین ادعایی علیه Claude از یک خط لوله پنج مرحله‌ای پیچیده پیروی می‌کرد. برخلاف هک‌های سنتی، در اینجا هیچ رمزنگاری شکست نخورد و هیچ وزن مدل (Model Weights) سرقت نشد. در عوض، این حمله بر پایه «مشاهده سیستماتیک» استوار بود.

آنتروپیک: علی‌بابا قابلیت‌های مدل کلود را به‌طور غیرقانونی استخراج کرد؛ بزرگ‌ترین حمله تقطیر شناخته‌شده

جزئیات خط لوله حمله

استراتژی برداشت پرامپت (Prompt Harvesting): مهاجمان مجموعه‌ای تخصصی از پرامپت‌ها را طراحی کردند که حوزه‌های استدلال، کدنویسی، پاسخ‌های منفی (Refusals) و موارد خاص (Edge Cases) را پوشش می‌داد. این پرامپت‌ها به‌گونه‌ای مهندسی شده بودند تا تنوع رفتارهای استخراج‌شده از کلود در هر پرس‌وجو به حداکثر برسد.
پرس‌وجوهای توزیع‌شده: علی‌بابا برای دور زدن سیستم‌های شناسایی و نظارتی، میلیون‌ها پرس‌وجو را در هزاران حساب کاربری مجزا و حوزه‌های قضایی مختلف پخش کرد. این تاکتیک باعث شد ترافیک ارسالی به جای یک عملیات برداشت سیستماتیک، شبیه به استفاده‌های تجاری و سازمانی عادی به نظر برسد.
ضبط توزیع خروجی: پاسخ‌های مدل — و در جاهایی که در دسترس بود، احتمالات توکن (Token Probabilities) — در یک مجموعه داده آموزشی مصنوعی (Synthetic Training Corpus) ثبت شدند. این فرآیند باعث شد الگوهای استدلالی و رفتارهای ایمنی کلود کدگذاری شوند.
تنظیم دقیق مدل شاگرد: یک مدل پایه رقیب — به‌طور مشخص از سری Qwen — روی این مجموعه داده‌های برداشت‌شده تنظیم دقیق (Fine-tuning) شد. این کار به مدل «شاگرد» اجازه می‌دهد تا پروفایل توانمندی مدل «استاد» را با کسری از هزینه‌های تحقیق و توسعه اصلی به ارث ببرد.
استقرار تجاری: مدل تقطیری سپس در محصولات سازمانی عرضه شد تا با یک بازه زمانی توسعه بسیار کوتاه، مستقیماً با مدلی که از آن تغذیه کرده بود، رقابت کند.

آنتروپیک: علی‌بابا به‌صورت غیرقانونی قابلیت‌های مدل کلود را استخراج کرد؛ بزرگ‌ترین حمله تقطیر شناخته‌شده

دقیقاً چه چیزی استخراج شد؟

اگر خروجی‌ها صرفاً متن هستند، چه چیزی برای سرقت وجود دارد؟ هدف، دانش خام و فکت‌ها نیست، بلکه «پروفایل رفتاری» است که توسط هوش مصنوعی قانون‌مدار (Constitutional AI) و یادگیری تقویت‌شده از طریق بازخورد انسانی (RLHF) ایجاد شده است. از آنجایی که آنتروپیک در آپریل ۲۰۲۶ مدلی داخلی را به عنوان توانمندترین مدل ساخته‌شده تا آن زمان توصیف کرده بود، هدف ادعایی، قابلیت‌های پیشرو وCutting-edge بوده است، نه نسخه‌های قدیمی.

قابلیت‌های خاص استخراج‌شده شامل موارد زیر است:

الگوهای استدلال: روش‌های خاصی که کلود برای خرد کردن مسائل پیچیده و چندمرحله‌ای به کار می‌برد.
پروفایل سبک: لحن و فرمت مشخصی که تجربه کاربری کلود را تعریف می‌کند.
همراستاسازی ایمنی: الگوهای خاص رد درخواست‌ها و اجتناب از آسیب (که بدون داشتن تضمین‌های ایمنی زیربنایی، صرفاً تقلید شده‌اند).
سقف توانمندسازی: محدوده عملکرد سطح بالا در کدنویسی و تحلیل‌های متون با بافت طولانی (Long-context).

اقتصاد سرقت مدل

عدم تقارن مالی باعث می‌شود این موضوع به جای یک پروژه مهندسی تک‌رو، به یک استراتژی در سطح هیئت‌مدیره تبدیل شود. طبق گزارش Stanford HAI AI Index 2024، آموزش یک مدل پیشرو با احتساب حقوق کارکنان تحقیق و اجراهای ناموفق، معمولاً بیش از ۱۰۰ میلیون دلار هزینه دارد.

در مقابل، گزارش فنی DeepSeek-V3 مستند کرد که اجرای نهایی آموزش آن تنها ۵.۶ میلیون دلار هزینه داشته است. این تفاوت فاحش در هزینه ورود ایجاد می‌شود: اگر رقیبی حدود ۵۰۰ هزار دلار برای توکن‌های API هزینه کند (با فرض ۵۰ میلیون پرس‌وجو با میانگین ۰.۰۱ دلار برای هر مورد) و چند میلیون دلار دیگر برای محاسبات تنظیم دقیق بپردازد، می‌تواند پروفایلی از قابلیت‌های ۱۰۰ میلیون دلاری را با هزینه‌ای کمتر از ۱۰ میلیون دلار شبیه‌سازی کند.

کارآگاهی و شناسایی

شناسایی این حملات به دلیل ظریف بودن امانه‌های برداشت (Harvesting Signatures) بسیار دشوار است. اکثر تیم‌ها نمی‌توانند یک کمپین برداشت را از یک شریک تجاری فعال که درخواست‌های زیادی می‌فرستد تشخیص دهند. کاربران سازمانی واقعی اغلب پرامپت‌های مشابهی را برای گردش کارهای خاص، مانند تیکت‌های پشتیبانی یا خلاصه‌سازی روزانه اسناد، تکرار می‌کنند.

در مقابل، یک کمپین برداشت، تنوع پرامپت‌ها را به سمت ۱.۰ می‌برد؛ یعنی تا حد ممکن پرس‌وجوهای منحصر‌به‌فرد و موارد خاص (Edge Cases) را می‌فرستد تا تمام سطح رفتاری مدل را به capture درآورد.

آنتروپیک: علی‌بابا به‌صورت غیرقانونی قابلیت‌های مدل کلود را استخراج کرد؛ بزرگ‌ترین حمله تقطیر شناخته‌شده

آنتروپیک ادعا می‌کند که یک خط‌کشی فارنزیک (Forensic Baseline) برای کمّی کردن این حملات دارد. اتهام آن‌ها که در نامه‌ای (طبق گزارش CNBC و رویترز در ۲۴ ژوئن ۲۰۲۶) آمده، این کمپین را «گستاخانه» و «غیرقانونی» توصیف کرده است. آن‌ها پیش از این سه آزمایشگاه دیگر چینی را نیز به کمپین‌های استخراج در مقیاس صنعتی متهم کرده بودند، هرچند علی‌بابا تا به امروز برجسته‌ترین نهاد نام‌برده شده است. این نشان می‌دهد که آزمایشگاه‌های پیشرو قابلیت‌های نظارتی داخلی برای رتبه‌بندی و اندازه‌گیری حجم استخراج دارند.

دریچه تخلیه فشار ژئوپلیتیکی

این درگیری محصول مستقیم کنترل‌های صادراتی آمریکا بر سخت‌افزار (Compute) است. وقتی واشنگتن دسترسی به تراشه‌های پیشرفته را محدود می‌کند، مسیر آموزش مدل‌های پیشرو از صفر بسته می‌شود. در این حالت، APIهای باز به یک «دریچه تخلیه فشار» تبدیل می‌شوند؛ جایی که محدودیت در سخت‌افزار، انگیزه برای استخراج در لایه نرم‌افزار را افزایش می‌دهد. این روند نشان می‌دهد که چگونه مدل‌های بازمتن توانسته‌اند اثرات محدودیت‌های صادراتی آمریکا را کاهش دهند و مسیرهای جایگزینی برای دستیابی به قدرت پردازشی ایجاد کنند.

آنتروپیک: علی‌بابا به‌صورت غیرقانونی قابلیت‌های مدل کلود را استخراج کرد؛ بزرگ‌ترین حمله تقطیر شناخته‌شده

این بُعد ژئوپلیتیکی به این معناست که سیاست‌های آمریکا و پارادوکس استخراج به‌طور فعال یکدیگر را تقویت می‌کنند. هرچه فشار بر سخت‌افزار بیشتر شود، تقطیر از طریق کانال‌های درآمدی جذاب‌تر می‌شود. این الگو پیش از این در ژانویه ۲۰۲۵ دیده شد، زمانی که انتشار DeepSeek R1 باعث اتهامات گسترده‌ای مبنی بر تقطیر از مدل‌های OpenAI شد؛ موضوعی که خود OpenAI اعلام کرد در حال بررسی آن است.

توهم همراستاسازی

پژوهشگران ایمنی، از جمله Jan Leike (رئیس بخش همراستاسازی در آنتروپیک)، هشدار می‌دهند که «ایمنی تقطیری» یک توهم خطرناک است. مدلی که صرفاً پاسخ‌های ردِ کلود را تقلید می‌کند، در واقع تضمین‌های ایمنی زیربنایی هوش مصنوعی قانون‌مدار را یاد نگرفته است؛ بلکه فقط یاد گرفته است که «ظاهرِ همراستا بودن» را تقلید کند.

تقلید رفتاری معادل همراستاسازی واقعی نیست. مدل شاگردی که یاد می‌گیرد یک پاسخ منفی را تقلید کند، نمی‌فهمد که چرا آن پاسخ منفی اهمیت دارد. این موضوع در گزارش «تأمین امنیت وزن‌های مدل هوش مصنوعی» (۲۰۲۴) توسط مؤسسه RAND نیز بازتاب یافته است، که توضیح می‌دهد چگونه قابلیت‌ها حتی بدون رخ دادن نقض امنیت وزن‌ها (Weights Breach)، از طریق کانال‌های دیگر نشت می‌کنند. این نگرانی‌ها در سطح государственный نیز وجود دارد، به‌طوری که دولت آمریکا پیش‌تر مدل Fable آنتروپیک را به دلیل ریسک‌های مشابه، تهدید امنیت ملی اعلام کرده بود.

بن‌بست حقوقی

از دیدگاه حقوقی، آنتروپیک دستش کوتاه است. اگرچه شرایط خدمات (ToS) در API به‌طور صریح استفاده از خروجی‌ها برای آموزش مدل‌های رقیب را ممنوع می‌کند، اما اجرای این قانون علیه یک نهاد خارجی که با دولت/حاکمیت گره خورده است، تقریباً غیرممکن است.

مکانیسم‌ها و موانع حقوقی:

شرایط خدمات (ToS): واضح‌ترین اهرم، نقض شرایط تجاری است، اما این امر مستلزم اثبات قصد و مقیاس در یک حوزه قضایی خارجی است.
قانون دفاع از اسرار تجاری (DTSA): اگر برداشت سیستماتیک ثابت شود، این قانون می‌تواند اعمال شود، اما باز بودن API، اثبات سرقت را سخت‌تر از یک نفوذ سنتی می‌کند. شاکی باید «قصد» را از طریق الگوهای ترافیکی بازسازی کند، زیرا هر پرس‌وجو در ظاهر یک تماس قانونی و پرداخت‌شده بوده است.
شکاف‌های قضایی: در حال حاضر هیچ رویه‌ای برای محاکمه موفقیت‌آمیز یک نهاد خارجی مرتبط با دولت برای سرقت مالکیت معنوی مبتنی بر تقطیر وجود ندارد.

واقع‌بینانه‌ترین اهرم فشار آنتروپیک شاید نه در دادگاه، بلکه در بخش مالی باشد. از آنجایی که علی‌بابا در بورس نیویورک (NYSE) و هنگ‌کنگ (HKEX) لیست شده است، اهرم‌های اعتباری و مالی خارج از دادرسی‌های حقوقی وجود دارد. این شکاف — و نه خودِ سرقت — نگرانی اصلی سیاست‌گذاران است.

این موضوع چه معنایی برای شما دارد؟

اگر در حال ساخت کسب‌وکاری هستید که در اصل یک «پوشش» (Wrapper) دور یک API پیشرو است، بدانید که قلعه دفاعی شما در حال تبدیل شدن به یک کالای عمومی (Commoditized) در زمان واقعی است. لایه مدل در حال تبدیل شدن به یک کالای کپی‌پذیر است. این تحولات بخشی از یک تغییر سریع‌تر در اکوسیستم است که در آن تغییرات بنیادین در استراتژی‌های مالی و عملیاتی شرکت‌های AI به چشم می‌خورد.

توصیه‌های استراتژیک برای سازندگان:

تنوع‌بخشی به دفاع: ارزش خود را به سمت داده‌های اختصاصی، ادغام‌های عمیق و جریان‌های کاری منحصر‌به‌فرد در دامنه تخصصی منتقل کنید. روی دسترسی خام به مدل به عنوان یک مزیت رقابتی تکیه نکنید.
ارزیابی هزینه-فایده: مدل‌های رقیبی ارزان‌تر و تقطیری شده (مانند برخی گونه‌های Qwen) ممکن است کیفیت نزدیک به مدل‌های پیشرو را با هزینه کمتر ارائه دهند، که به آژانس‌ها اجازه می‌دهد با ترکیب ارائه‌دهندگان، هزینه‌ها را کاهش دهند.
ایمن‌سازی حجم‌های کاری: برای کسانی که با داده‌های حساس سروکار دارند، به سمت استقرارهای خصوصی حرکت کنید. گزینه‌هایی مانند Claude for Enterprise یا نقاط انتهایی خصوصی Amazon Bedrock سطح حمله API عمومی را به‌طور کامل حذف می‌کنند.
آمادگی برای تطبیق: انتظار موجی از تأییدات KYC (شناخت مشتری) و محدودیت‌های جغرافیایی سخت‌گیرانه‌تر در دسترسی به API را داشته باشید، زیرا آزمایشگاه‌ها بقای مالکیت معنوی خود را در اولویت قرار می‌دهند.

پیش‌بینی‌های آینده (۲۰۲۶–۲۰۲۸)

۱. نیمه دوم ۲۰۲۶: احراز هویت پیشرفته و مسدود کردن حساب‌های وابسته به نهادهای خاص برای دسترسی به لایه‌های پیشرو به یک استاندارد تبدیل خواهد شد.
۲. ۲۰۲۶–۲۰۲۷: احتمال ثبت شکایت تحت DTSA یا ارجاع به FBI برای جاسوسی اقتصادی در صورت کافی بودن شواهد فارنزیک، که می‌تواند یک رویه حقوقی ایجاد کند.
۳. ۲۰۲۷: گسترش کنترل‌های صادراتی هوش مصنوعی توسط کنگره با استفاده از این حادثه به عنوان مستنداتی برای اجباری کردن احراز هویت نهادهای خارجی. این با استدلال‌های هلن تونر از CSET دانشگاه جورج‌تاون در گزارش ۲۰۲۴ درباره کنترل دسترسی به محاسبات ابری همسو است.
۴. ۲۰۲۸ به بعد: تغییر دائمی به سمت استقرارهای پیشرو که فقط روی سخت‌افزار قفل شده و در محل (On-prem) هستند، که به‌طور مؤثر مدل API عمومی را برای توانمندترین سیستم‌ها به پایان می‌برد.

پرونده آنتروپیک و علی‌بابا ممکن است به نزاع تعیین‌کننده مالکیت معنوی در عصر هوش مصنوعی تبدیل شود، درست مانند اختلافات نیمه‌هادی‌های کوالکام و هواوی. این اتفاق، هزینه «باز بودن» را به عنوان یک ریسک استراتژیک بازتعریف می‌کند.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

آنتروپیک علیه علی‌بابا: استخراج صنعتی قابلیت‌های مدل کلود از طریق API

Dev.to AI

منبع خبر

۲۳ دقیقه پیش·۴ تیر ۱۴۰۵۲۶ دقیقه مطالعه

آنتروپیک: علی‌بابا قابلیت‌های مدل کلود را به‌طور غیرقانونی استخراج کرد؛ بزرگ‌ترین حمله تقطیر شناخته‌شده

اشتراک‌گذاری