چگونه ابزار متن‌باز انویدیا نرخ خطای مدل‌های زیست‌مولکولی را حذف کرد؟

منبع خبر

۲ ساعت پیش·۹ تیر ۱۴۰۵۵ دقیقه مطالعه

ابزارک عامل بیونمو انویدیا: تبدیل مدل‌های زیست‌مولکولی به مهارت‌های قابل فراخوانی برای عامل‌های هوش مصنوعی در کشف دارو

اشتراک‌گذاری

تصور کنید یک پژوهشگر دارویی که به جای کلنجار رفتن با خطاهای مداوم کدنویسی و حدس زدن فرمت‌های ورودی، ابزاری دارد که دقیقاً می‌داند هر مدل زیست‌مولکولی چگونه باید فراخوانی شود. این تغییر رویکرد، نرخ موفقیت عامل‌های هوش مصنوعی در تکمیل وظایف کشف دارو را از ۵۷.۱٪ به عدد مطلق ۱۰۰٪ رسانده است.

انویدیا (NVIDIA) برای پر کردن شکاف میان عامل‌های کدنویس با هدف عمومی و نیازهای صلب و سخت‌گیرانه علوم فیزیکی، کیت عامل BioNeMo (BioNeMo Agent Toolkit) را معرفی کرد. طبق بررسی‌های مفصلی که در وب‌سایت MarkTechPost منتشر شده است، این ابزار اجازه می‌دهد مدل‌های پیچیده زیستی به جای دستورات متنی مبهم یا تکیه بر استدلال کلی مدل، به صورت «مهارت‌های» (Skills) مستند و قابل فراخوانی تعریف شوند تا عامل بتواند آن‌ها را شناسایی و اجرا کند بدون آنکه در مورد پارامترها دچار توهم شود.

کشف علمی شبیه مهندسی نرم‌افزار نیست؛ در دنیای نرم‌افزار، یک مجموعه تست (Test Suite) وجود دارد که وقتی فرضیه درست باشد، چراغش سبز می‌شود. اما در اکتشافات علمی، چنین چیزی وجود ندارد و فرآیند discovery اساساً تکرارشونده، غیرقطعی و متصل به دنیای فیزیکی است. همان‌طور که پیش از این در تحلیل خود درباره نحوه ساخت سامانه‌های RAG چندعاملی توسط شرکت‌هایی مانند Bayer برای کشف دارو اشاره کردیم، چالش اصلی همواره این بوده است که عامل‌های هوش مصنوعی عمومی اغلب فرمت ابزارها و ورودی‌های لازم را به اشتباه حدس می‌زنند. این چالش با نتایج بنچمارک‌های سخت‌گیرانه‌ای همسو است که در آن‌ها مدل‌های برتر زیست‌شناسی حتی در ۶۴٪ از تکالیف پژوهشی شکست خوردند و نیاز به ساختارهایی قطعی‌تر را به اثبات رساند. کیت BioNeMo با بسته‌بندی مدل‌ها در قالب مهارت‌های مستند، این مشکل را حل می‌کند تا مدل‌ها بدون توهم (Hallucination) — شبیه دوستی که خاطره‌ای را اشتباه تعریف می‌کند — پارامترها را اجرا کنند.

منطق سیستم و زمینه (Context)

این مخزن متن‌باز به‌گونه‌ای طراحی شده است تا سقف توانایی عامل‌های هوش مصنوعی به دلیل استفاده نامطمئن از ابزارها محدود نشود. در تحقیقات زیست‌مولکولی، یک عامل (Agent) تنها به اندازه ابزارهایی که می‌تواند به‌درستی و با کارایی بالا فراخوانی کند، موثر است.

این کیت با تبدیل مدل‌های زیست‌مولکولی انویدیا به مهارت‌های مستند، به عامل‌ها اجازه می‌دهد تا مدل‌ها را به‌طور автоном (خودمختار) بخوانند، انتخاب کنند و تفسیر نمایند. برای مدیریت بهینه این فرآیند، مخزن مهارت‌ها را در سه دسته تخصصی سازمان‌دهی کرده است: nim-skills ،open-models-skills و library-skills. علاوه بر این، یک پوشه مجزا برای «جریان‌های کاری» (Workflows) تعبیه شده است تا متا-مهارت‌های پیچیده و چندمرحله‌ای در آن قرار گیرند.

معماری مهارت‌های BioNeMo

پلتفرم BioNeMo به دو لایه متمایز تقسیم شده است تا تفکیک بین مدل و اجرای آن حفظ شود:

لایه ابزارهای شتاب‌یافته (Accelerated Tool Layer): این لایه از NVIDIA NIM (میکروسرویس‌های استنتاج) و مدل‌های باز استفاده می‌کند. برای افزایش سرعت، این بخش توسط کتابخانه‌های تخصصی شتاب می‌یابد؛ به طور خاص از cuEquivariance برای مدل‌های ساختاری و Parabricks برای تحلیل‌های ژنومیک استفاده می‌شود.
رابط‌های آمادهٔ عامل (Agent-Ready Interfaces): این لایه قابلیت‌ها را در قالب «مهارت» می‌پیچد. هر مهارت در قالب یک دایرکتوری (پوشه) تعریف شده که حاوی یک فایل SKILL.md است. این فایل از YAML frontmatter استفاده می‌کند و شامل دستورالعمل‌ها، مراجع اختیاری و اسکریپت‌های کمکی است. در این مستندات، هدف مدل، ورودی‌های مورد نیاز، پارامترهای اختیاری، مصنوعات (Artifacts) مورد انتظار و به‌طور مهم، حالت‌های شکست (Failure Modes) خاص هر مدل ذکر شده است.

برای مدل‌هایی که هنوز به صورت NIM بسته‌بندی نشده‌اند، این ابزار از رپرهای سرور پروتکل زمینهٔ مدل (MCP) استفاده می‌کند تا آن‌ها را برای عامل قابل شناسایی کند. در زمینه استقرار، کاربران دو انتخاب دارند: نقاط انتهایی (Endpoints) میزبانی‌شده (از طریق build.nvidia.com) که دسترسی سریع برای توسعه در مقیاس کوچک فراهم می‌کند، و استقرار محلی NIM (مانند http://localhost:8000) که برای تکرارهای مداوم، کاهش تأخیر در گرم شدن مدل (Warm Latency) و حفظ محلی بودن داده‌ها به کار می‌رود.

پیاده‌سازی و نمونه‌های کاربردی

نصب این ابزار از طریق یک CLI (رابط خط فرمان) متن‌باز انجام می‌شود. کاربران می‌توانند مهارت‌ها را به‌صورت تعاملی مرور کنند یا با استفاده از دستور npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit آن‌ها را اضافه کنند. همچنین می‌توان یک مهارت خاص را برای یک عامل مشخص نصب کرد، مثلاً: npx skills add NVIDIA-BioNeMo/bionemo-agent-toolkit --skill boltz2-nim --agent claude-code.

این کیت از طیف گسترده‌ای از مدل‌های تخصصی پشتیبانی می‌کند، از جمله: Boltz-2، DiffDock، GenMol، ProteinMPNN، MSA Search، RFdiffusion و Evo 2. نمونه‌های کاربردی عبارتند از:

پیش‌بینی ساختار پروتئین: استفاده از Boltz-2 یا OpenFold3 برای تا کردن (Folding) یک توالی پپتیدی (مثلاً MKTVRQERLKSIVR) و بازگرداندن یک فایل CIF.
همترازی توالی‌های متعدد (MSA): تولید یک MSA با استفاده از MMseqs2 از طریق مهارت MSA Search برای تولید فایل A3M.
شیمی زاینده (Generative Chemistry): استفاده از GenMol برای تولید مولکول‌های کاندید، که خروجی‌ها را در قالب فایل‌های SDF یا SMILES برای فیلتر کردن ارائه می‌دهد.

فراتر از تک‌فراخوانی‌ها، این ابزار امکان تعریف «متا-مهارت‌ها» یا جریان‌های کاری چندمرحله‌ای را فراهم می‌کند. به عنوان مثال، در جریان کاری generative_protein_binder_design سه مدل به‌صورت زنجیره‌ای عمل می‌کنند: ابتدا RFdiffusion اسکلت پروتئین را می‌سازد، سپس ProteinMPNN توالی را طراحی می‌کند و در نهایت OpenFold3 ساختار نهایی را اعتبارسنجی می‌کند.

بنچمارک‌ها و تحلیل عملکرد

آزمون‌های انجام شده با Codex CLI که مدل سریع GPT-5.5 را اجرا می‌کرد، تضاد شدیدی را میان عامل‌های عمومی و عامل‌های مجهز به مهارت نشان داد:

تکمیل وظایف: بدون استفاده از مهارت‌ها، عامل‌ها به‌طور متوسط تنها ۵۷.۱٪ از وظایف مورد نیاز را کامل می‌کردند. اما با استفاده از مهارت‌های NIM، این نرخ به ۱۰۰٪ رسید.
بهره‌وری توکن: عامل‌های مجهز به مهارت، در هر ۱۰۰۰ توکن، ۲ برابر assertions (مراحل تأییدشده تک‌تک گام‌های یک وظیفه) بیشتری تولید کردند. این افزایش بهره‌وری در تمامی ۱۰ مهارت NIM آزمایش‌شده مشاهده شد.
مدیریت خطا: در حالی که عامل‌های عمومی با حالت‌های شکست ناشناخته مواجه می‌شدند، عامل‌های BioNeMo از حالت‌های شکست مستند شده برای هر مهارت استفاده می‌کنند.

این تغییر، فرض بنیادین زیست‌شناسی مبتنی بر هوش مصنوعی را عوض می‌کند. به‌جای امید به اینکه یک مدل پیشرو APIهای پیچیده را «بفهمد»، عامل اکنون یک دفترچه راهنما (Manual) را برای یک مهارت خاص می‌خواند و آن را اجرا می‌کند. این کار بار شناختی مدل زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن جواب می‌دهد — را کم کرده و قابلیت اطمینان را به لایه قطعیِ ابزار (Deterministic Tool Layer) منتقل می‌کند.

به باور انویدیا، سقف توانایی عامل‌ها دیگر وابسته به استدلال کلی مدل نیست، بلکه به کیفیت مجموعه ابزارهای ارائه شده بستگی دارد. با این حال، انویدیا هشدار می‌دهد که نقاط انتهایی میزبانی‌شده صرفاً برای توسعه هستند و برای محیط عملیاتی (Production) نیستند. پژوهشگران باید ساختارهای با اطمینان پایین را به‌صورت دستی اعتبارسنجی کنند و مولکول‌های تولید شده را پیش از اعتماد به نتایج، فیلتر نمایند.

گام بعدی شما

اگر توسعه‌دهنده هستید، ابتدا یک محیط اجرای عاملی مانند Claude یا Codex و یک API Key انویدیا تهیه کنید. سپس عامل خود را به مخزن مهارت‌ها متصل کنید تا قابلیت‌های موجود را فهرست کرده و سپس مهارت‌های مورد نیاز برای هر مدل را اختصاص دهید.
برای پروژه‌های مقیاس کوچک از NIM Endpoints و برای تکرارهای سریع، تأخیر کمتر و امنیت داده‌های حساس از استقرار محلی (Local) استفاده کنید.
جریان‌های کاری چندمرحله‌ای (Meta-skills) را برای جایگزینی زنجیره‌های دستیِ مدل‌ها تست کنید تا سرعت تخمین ساختارها افزایش یابد.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است؛ برای درک اینکه این مدل‌ها چگونه روی تراشه‌های Blackwell اجرا می‌شوند، به تحلیل ما درباره معماری جدید انویدیا مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

چگونه ابزار متن‌باز انویدیا نرخ خطای مدل‌های زیست‌مولکولی را حذف کرد؟

MarkTechPost

منبع خبر

۲ ساعت پیش·۹ تیر ۱۴۰۵۵ دقیقه مطالعه

اشتراک‌گذاری