خودکارسازی استنتاج محلی با PowerShell و Local Foundry مایکروسافت

اگر از هزینه‌های رو به رشد توکن‌ها و محدودیت‌های سختگیرانه ابری خسته شده‌اید، زمان آن رسیده که بارهای کاری هوش مصنوعی را به سخت‌افزار NPU منتقل کنید. اکنون می‌توانید با حذف ارائه‌دهندگان ابری، استنتاج (Inference) — که شبیه خودِ آشپزی است و نه دوره‌ی آموزش آشپز — را کاملاً در محیط محلی خود مدیریت کنید.

سوبسیدهای ابری شرکت‌هایی مثل OpenAI و Anthropic به‌آرامی در حال پایان یافتن است. این روند حذف وابستگی به سرویس‌های ابری، مشابه تجربه‌ای است که بسیاری از توسعه‌دهندگان برای رساندن هزینه‌های API به صفر از طریق مدل‌های محلی گزارش کرده‌اند. هم‌زمان، قوانینی مثل EU Cloud Act و GDPR، میزبانی محلی داده‌ها را برای کاربران اروپایی به یک ضرورت تبدیل کرده است. همان‌طور که در تحلیل‌های پیشین ما درباره‌ی مدل‌های زبانی کوچک (SLM) اشاره کردیم، تمایل به مدل‌های بهینه‌تر در حال افزایش است. طبق یک راهنمای فنی که در ۱۴ مه ۲۰۲۶ در dev.to منتشر شد، ابزار Microsoft Local Foundry با ارائه یک SDK و CLI برای ویندوز، لینوکس و مکوس، این چالش را حل می‌کند.

Cover image for Using Azure Local Foundry CLI with PowerShell

این ابزار به شما اجازه می‌دهد مدل‌ها را با دستورات ساده مدیریت کنید: با list مدل‌های موجود را ببینید، با download آن‌ها را در حافظه موقت ذخیره کنید و با load سرویس را فعال نمایید. برای کسانی که از PowerShell استفاده می‌کنند، این ادغام از طریق یک REST API انجام می‌شود که کاملاً با استانداردهای Chat Completion شرکت OpenAI سازگار است.

جزئیات فنی کلیدی این سیستم عبارتند از:

پشتیبانی از مدل‌هایی مانند phi-3-mini-128k-instruct-qnn-npu:3. در کنار این مدل‌های بهینه، تلاشات برای افزایش سرعت استنتاج در سخت‌افزارهای محلی ادامه دارد؛ برای مثال گزارش‌های فنی نشان‌دهنده دستیابی مدل Gemma 4 به سرعت‌های خیره‌کننده روی سخت‌افزارهای گرافیکی است.
ساختاری مبتنی بر جفت‌های نقش/محتوا (سیستم، کاربر و دستیار).
قابلیت تنظیم خلاقیت از طریق پارامتر Temperature بین ۰ تا ۲.

این تغییر یعنی توسعه‌دهندگان می‌توانند کارهای فرمت‌بندی یا خلاصه‌سازی را بدون پرداخت حتی یک توکن ابری خودکار کنند. در واقع، یک لپ‌تاپ معمولی با تراشه‌ی NPU — که شبیه یک آشپز تخصصی است و فقط یک کار خاص را با سرعت خیره‌کننده انجام می‌دهد — به یک سرور هوش مصنوعی خصوصی و برنامه‌ریزی‌پذیر تبدیل می‌شود. نتیجه‌ی این اتفاق برای کاربر، صورت‌حساب صفر استنتاج و حاکمیت کامل بر داده‌ها است.

اگرچه REST API اکثر نیازها را پوشش می‌دهد، اما کسانی که به دنبال یکپارچه‌سازی عمیق‌تر هستند، می‌توانند از SDK دات‌نت (.NET) برای باز کردن تمام قابلیت‌های این ابزار استفاده کنند.

گام بعدی شما

سازگاری سخت‌افزار خود با تراشه‌های NPU را بررسی کنید.
برای کاهش هزینه‌ها، متدهای تکراری خلاصه‌سازی را به Local Foundry منتقل کنید.
مستندات SDK دات‌نت را برای پیاده‌سازی‌های پیچیده‌تر مطالعه کنید.

اما تأثیر این حرکت بر سخت‌افزارهای نسل جدید حتی جذاب‌تر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell و آینده‌ی پردازش لبه مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

Cover image for Using Azure Local Foundry CLI with PowerShell

جزئیات فنی کلیدی این سیستم عبارتند از:

پشتیبانی از مدل‌هایی مانند phi-3-mini-128k-instruct-qnn-npu:3. در کنار این مدل‌های بهینه، تلاشات برای افزایش سرعت استنتاج در سخت‌افزارهای محلی ادامه دارد؛ برای مثال گزارش‌های فنی نشان‌دهنده دستیابی مدل Gemma 4 به سرعت‌های خیره‌کننده روی سخت‌افزارهای گرافیکی است.
ساختاری مبتنی بر جفت‌های نقش/محتوا (سیستم، کاربر و دستیار).
قابلیت تنظیم خلاقیت از طریق پارامتر Temperature بین ۰ تا ۲.

گام بعدی شما

سازگاری سخت‌افزار خود با تراشه‌های NPU را بررسی کنید.
برای کاهش هزینه‌ها، متدهای تکراری خلاصه‌سازی را به Local Foundry منتقل کنید.
مستندات SDK دات‌نت را برای پیاده‌سازی‌های پیچیده‌تر مطالعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

خودکارسازی استنتاج محلی با PowerShell و Local Foundry مایکروسافت

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

خودکارسازی استنتاج محلی با PowerShell و Local Foundry مایکروسافت

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

خودکارسازی استنتاج محلی با PowerShell و Local Foundry مایکروسافت

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

خودکارسازی استنتاج محلی با PowerShell و Local Foundry مایکروسافت

گام بعدی شما

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران