تصور کنید هفتهای ۲۰ ساعت از زمان متخصصان خود را صرف بررسی دستی فایلهای مهندسی کنید تا بفهمید آیا یک قطعه واقعاً قابل تولید است یا خیر. MachinaCheck این فرآیند خستهکننده را به تنها ۴۰ ثانیه کاهش داده است.
این سیستم با اتوماسیون بررسی فایلهای STEP، ریسک پذیرش پروژههایی که فراتر از توان فنی یا موجودی ابزار یک کارگاه هستند را بهطور کامل حذف میکند. همانطور که در تحلیلهای پیشین ما دربارهی هوش مصنوعی حاکمیتی (Sovereign AI) اشاره کردیم، کنترل کامل بر دادهها در صنایع حساس، اولویت اول است.
به نقل از مستندات این پروژه که در ۱۰ مه ۲۰۲۶ در Hugging Face منتشر شد، این سیستم پاسخی مستقیم به نیازهای امنیتی بخشهای هوافضا و تجهیزات پزشکی است. از آنجا که فایلهای CAD حاوی مالکیت معنوی بسیار حساسی هستند، ارسال آنها به APIهای ابری تجاری اغلب نقض قراردادهای محرمانگی است. به همین دلیل، MachinaCheck از معماری «حریمخصوصی در طراحی» استفاده میکند تا تمام دادهها در محیط داخلی کارگاه باقی بمانند.
قلب تپنده این سیستم، سختافزار AMD Instinct MI300X است که با ۱۹۲ گیگابایت حافظه HBM3 VRAM، امکان میزبانی مدل Qwen 2.5 7B Instruct را از طریق vLLM و ROCm فراهم میکند. این خط لوله از پنج جزء تخصصی تشکیل شده است:
• استخراجکننده فایل STEP: استفاده از cadquery برای استخراج ویژگیها با دقت ۱۰۰٪ ریاضی (مانند قطر حفرهها).
• طبقهبندی عملیات: یک عامل (Agent) — تشبیه روزمره: مثل یک کارمند متخصص که نه فقط حرف میزند، بلکه ابزارهای مختلف را برای رسیدن به هدف به کار میگیرد — بر پایه مدل Qwen که عملیات مورد نیاز CNC را تعیین میکند.
• تطبیق ابزار: یک اسکریپت پایتون قطعی که دیتابیس کارگاه را میکاود تا از توهم (Hallucination) — تشبیه روزمره: وقتی مدل با اطمینان چیزی میگوید که اصلاً وجود ندارد — مدل زبانی جلوگیری کند.
• عامل امکانسنجی: لایهای استدلالی که تصمیم نهایی (مثلاً «مشروط») و پرچمهای ریسک را تولید میکند.
• تولیدکننده گزارش: ترکیب نهایی نتایج در قالب یک گزارش جامع.
این رویکرد ترکیبی — یعنی استفاده از پایتون برای بازیابی دادهها و مدل زبانی بزرگ (LLM) — تشبیه روزمره: مثل کتابخانهداری که میلیاردها صفحه را خوانده و حالا با همان لحن کتابها جواب میدهد — برای استدلال — یک چرخش در طراحی سیستمهای عاملمحور است. با محدود کردن مدل به استدلال سطح بالا و سپردن جستوجوی دیتابیس به کد خالص، زمان کل استنتاج (Inference) — تشبیه روزمره: لحظهای که مدل واقعاً جواب تولید میکند — به ۲۵ تا ۴۰ ثانیه رسیده است.
گام بعدی شما
- اگر مدیر کارگاه یا مهندس تولید هستید، خط لوله این پروژه را در Hugging Face Space تست کنید.
- برای درک نحوه پیادهسازی محاسبات محلی، سورسکد پروژه را در GitHub بررسی کنید.
- استراتژی جایگزینی APIهای ابری با مدلهای محلی را در جریان کاری خود بسنجید.
اما داستان سختافزاری این تحول حتی شگفتانگیزتر است؛ برای درک اینکه چرا AMD در حال به چالش کشیدن انحصار انویدیا در استنتاج محلی است، به تحلیل ما دربارهی تراشههای Instinct مراجعه کنید.




گفتگو