تصور کنید بیمارستانی که در آن هوش مصنوعی سرطانشناسی، بدون خروج حتی یک بایت داده از محیط داخلی، تصمیمات بالینی میگیرد. اگر هنوز تصور میکنید برای دستیابی به دقت پزشکی بالا، ناچار به استفاده از مدلهای ابری غولپیکر هستید، باید با OncoAgent آشنا شوید.
طبق یک پیشطرح فنی که در ۹ مه ۲۰۲۶ منتشر شد، چارچوب OncoAgent امکان اجرای کامل یک پشتهی عاملمحور (Agentic Stack) را تنها روی یک نمونه سختافزاری AMD Instinct MI300X فراهم میکند. این دستاورد به بیمارستانها اجازه میدهد تا بدون نیاز به APIهای تجاری و بسته، حاکمیت کامل بر دادههای خود داشته باشند و در عین حال، پشتیبانی دقیقی در حوزه سرطانشناسی دریافت کنند.
همانطور که در تحلیلهای قبلی ما دربارهی هوش مصنوعی حاکمیتی (Sovereign AI) اشاره کردیم، حذف وابستگی به ابر در محیطهای حساس، دیگر یک انتخاب نیست، بلکه یک ضرورت امنیتی است. این رویکرد در تضاد کامل با استراتژیهای شرکتهای بزرگ است که سعی میکنند دسترسی به مدلهای پیشرفته را در محیطهای بسته کنترل کنند؛ موضوعی که در بررسی استراتژی «باغ محصور» OpenAI برای ابزارهای حساس به تفصیل به آن پرداختیم. در حالی که اکثر ابزارهای فعلی با قوانین HIPAA و GDPR در تضاد هستند، OncoAgent تمام خروجیهای خود را به یک پایگاه دانش برداری از ۷۰ مورد از دستورالعملهای درجهیک NCCN و ESMO متصل میکند.
این سیستم بر پایه یک توپولوژی ۸ گرهای LangGraph بنا شده است که پرسوجوهای بالینی را از طریق یک امتیازدهنده پیچیدگی هدایت میکند. بر اساس شدت مورد، سیستم یکی از دو مسیر را انتخاب میکند: یک مدل بهینهشده برای سرعت با ۹ میلیارد پارامتر (لایه ۱) یا یک مدل استدلالی عمیق با ۲۷ میلیارد پارامتر (لایه ۲). جزئیات فنی این زیرساخت عبارت است از:
- آموزش: تنظیم دقیق (Fine-tuning) از طریق QLoRA روی ۲۶۶,۸۵۴ مورد واقعی و مصنوعی با استفاده از چارچوب Unsloth.
- خط لوله RAG: یک فرآیند چهار مرحلهای با استفاده از بردارهای معنایی (Embedding) مدل S-PubMedBert-MS-MARCO و یک دروازه فاصله (آستانه ۰.۱۰) برای مسدود کردن توهمات (Hallucinations) خارج از دامنه.
- عملکرد: استفاده از Sequence Packing روی سختافزار MI300X، زمان آموزش کل مجموعه داده را از ۵ ساعت تخمینی به تنها ۵۰ دقیقه کاهش داد.
- ایمنی: یک گره حذف اطلاعات شناسایی بیمار (Zero-PHI) و یک منتقد سه لایه Reflexion تضمین میکنند که هیچ داده حساس به مدل زبانی بزرگ (LLM) نرسد و تمام توصیهها مبنیسازی (Grounding) شده باشند.
این معماری، معیار سنجش AI بالینی را از «دقت ساده مدل» به «حاکمیت استقرار» تغییر میدهد. با اثبات اینکه یک مدل ۲۷ میلیارد پارامتری میتواند بهصورت محلی با نرخ موفقیت ۱۰۰ درصدی در طبقهبندی اسناد سرو شود، OncoAgent «مالیات حریم خصوصی» مدلهای تجاری را حذف میکند. همچنین، شتاب ۵۶ برابری در تولید دادههای مصنوعی نشان میدهد که معماری CDNA3 شرکت AMD در خط لولههای استاندارد HuggingFace بهشدت دستنخورده مانده است.
گام بعدی شما
- انتشار عمومی مجموعه دادههای مصنوعی OncoCoT در Hugging Face را دنبال کنید تا نحوه مقیاسبندی تنظیمات تخصصی در سایر حوزههای حساس را ارزیابی کنید.
- بررسی کنید که آیا زیرساخت سختافزاری شما توانایی پشتیبانی از مدلهای استدلالی لایه ۲ (۲۷B) را بهصورت محلی دارد یا خیر.
- استراتژیهای جایگزینی RAGهای ساده با خط لولههای Corrective RAG چهار مرحلهای را در پروژههای خود پیاده کنید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چرا تراشههای AMD در حال تغییر بازی هستند، به تحلیل ما دربارهی معماری Blackwell و رقبای آن مراجعه کنید.
گفتگو