بودجه AI شما با تخفیف ۷۵ درصدی DeepSeek دگرگون می‌شود

آیا بودجه‌ی فعلی شما برای استنتاج مدل‌های زبانی، کاهش ۹۰ درصدی هزینه‌های کش را تاب می‌آورد؟ دیپ‌سیک (DeepSeek) با یک بازنگری تهاجمی در قیمت‌گذاری، قصد دارد توسعه‌دهندگان را به اجبار به سمت معماری جدید V4 سوق دهد.

طبق اعلام مستندات api-docs.deepseek.com در ۶ می ۲۰۲۶، این شرکت مدل‌های اصلی خود را به deepseek-v4-flash و deepseek-v4-pro تغییر داده است. جذاب‌ترین بخش این به‌روزرسانی، تخفیف ۷۵ درصدی مدل Pro است که تا ۳۱ می ۲۰۲۶ اعتبار دارد و هزینه‌های عملیاتی را به شدت کاهش می‌دهد.

مشخصات فنی این مدل‌های جدید به شرح زیر است:

deepseek-v4-flash: قیمت ۰.۱۴ دلار برای هر ۱ میلیون توکن ورودی (در صورت عدم برخورد با کش) و ۰.۲۸ دلار برای هر ۱ میلیون توکن خروجی.
deepseek-v4-pro: قیمت تخفیف‌خورده ۰.۴۳۵ دلار برای هر ۱ میلیون توکن ورودی و ۰.۸۷ دلار برای هر ۱ میلیون توکن خروجی.
زیرساخت: هر دو مدل از پنجره بافت (Context Window) ۱ میلیون توکنی و حداکثر خروجی ۳۸۴ هزار توکن پشتیبانی می‌کنند.

همان‌طور که در تحلیل قبلی ما درباره‌ی رقابت مدل‌های استدلالی اشاره کردیم، کاهش هزینه‌ها تنها یک ابزار برای جذب کاربر نیست، بلکه تلاشی برای تغییر استانداردهای صنعت است. بر اساس بررسی منابع متعدد، دیپ‌سیک برای بهینه‌سازی حجم‌های کاری تکراری، قیمت برخورد با کش (Cache Hit) ورودی را در ۲۶ آوریل ۲۰۲۶ به یک‌دهم قیمت زمان عرضه کاهش داد. این یعنی هزینه کش برای مدل Flash تنها ۰.۰۰۲۸ دلار برای هر ۱ میلیون توکن است.

این تغییرات با پاک‌سازی اکوسیستم مدل‌ها همراه شده است. طبق گزارش این شرکت، شناسه‌های deepseek-chat و deepseek-reasoner بازنشسته می‌شوند؛ چرا که این دو اکنون به ترتیب حالت‌های «غیر استدلالی» و «استدلالی» مدل V4-Flash تبدیل شده‌اند.

در حالی که رقابت برای تسلط بر مدل‌های استدلالی (Reasoning Models) شدت می‌یابد، اکنون صنعت منتظر است ببیند آیا رقبایی چون OpenAI یا Anthropic برای جذب مشتریان سازمانی، قیمت‌های زیر یک سنت برای کش را پذیرفته‌اند یا خیر.

اما این جنگ قیمت‌ها تنها بخشی از ماجراست؛ تأثیر این مدل‌ها بر بازار سخت‌افزاری را در گزارش بعدی بررسی خواهیم کرد.

گام بعدی شما

اگر از مدل‌های قدیمی استفاده می‌کنید، پیش از ۳۱ می ۲۰۲۶ به V4-Pro مهاجرت کنید تا از تخفیف ۷۵ درصدی بهره‌مند شوید.
پرامپت‌های خود را برای بهره‌گیری حداکثری از Cache Hit بهینه‌سازی کنید تا هزینه‌ها را تا ۹۰٪ کاهش دهید.
برای تسک‌های با حجم بالا و سرعت زیاد، مدل V4-Flash را جایگزین مدل‌های سنگین‌تر کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

مشخصات فنی این مدل‌های جدید به شرح زیر است:

deepseek-v4-flash: قیمت ۰.۱۴ دلار برای هر ۱ میلیون توکن ورودی (در صورت عدم برخورد با کش) و ۰.۲۸ دلار برای هر ۱ میلیون توکن خروجی.
deepseek-v4-pro: قیمت تخفیف‌خورده ۰.۴۳۵ دلار برای هر ۱ میلیون توکن ورودی و ۰.۸۷ دلار برای هر ۱ میلیون توکن خروجی.
زیرساخت: هر دو مدل از پنجره بافت (Context Window) ۱ میلیون توکنی و حداکثر خروجی ۳۸۴ هزار توکن پشتیبانی می‌کنند.

گام بعدی شما

اگر از مدل‌های قدیمی استفاده می‌کنید، پیش از ۳۱ می ۲۰۲۶ به V4-Pro مهاجرت کنید تا از تخفیف ۷۵ درصدی بهره‌مند شوید.
پرامپت‌های خود را برای بهره‌گیری حداکثری از Cache Hit بهینه‌سازی کنید تا هزینه‌ها را تا ۹۰٪ کاهش دهید.
برای تسک‌های با حجم بالا و سرعت زیاد، مدل V4-Flash را جایگزین مدل‌های سنگین‌تر کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

بودجه AI شما با تخفیف ۷۵ درصدی DeepSeek دگرگون می‌شود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

بودجه AI شما با تخفیف ۷۵ درصدی DeepSeek دگرگون می‌شود

گام بعدی شما

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

بودجه AI شما با تخفیف ۷۵ درصدی DeepSeek دگرگون می‌شود

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

بودجه AI شما با تخفیف ۷۵ درصدی DeepSeek دگرگون می‌شود

گام بعدی شما

مقاله‌های مرتبطهمه ←

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران