آیا بودجهی فعلی شما برای استنتاج مدلهای زبانی، کاهش ۹۰ درصدی هزینههای کش را تاب میآورد؟ دیپسیک (DeepSeek) با یک بازنگری تهاجمی در قیمتگذاری، قصد دارد توسعهدهندگان را به اجبار به سمت معماری جدید V4 سوق دهد.
طبق اعلام مستندات api-docs.deepseek.com در ۶ می ۲۰۲۶، این شرکت مدلهای اصلی خود را به deepseek-v4-flash و deepseek-v4-pro تغییر داده است. جذابترین بخش این بهروزرسانی، تخفیف ۷۵ درصدی مدل Pro است که تا ۳۱ می ۲۰۲۶ اعتبار دارد و هزینههای عملیاتی را به شدت کاهش میدهد.
مشخصات فنی این مدلهای جدید به شرح زیر است:
- deepseek-v4-flash: قیمت ۰.۱۴ دلار برای هر ۱ میلیون توکن ورودی (در صورت عدم برخورد با کش) و ۰.۲۸ دلار برای هر ۱ میلیون توکن خروجی.
- deepseek-v4-pro: قیمت تخفیفخورده ۰.۴۳۵ دلار برای هر ۱ میلیون توکن ورودی و ۰.۸۷ دلار برای هر ۱ میلیون توکن خروجی.
- زیرساخت: هر دو مدل از پنجره بافت (Context Window) ۱ میلیون توکنی و حداکثر خروجی ۳۸۴ هزار توکن پشتیبانی میکنند.
همانطور که در تحلیل قبلی ما دربارهی رقابت مدلهای استدلالی اشاره کردیم، کاهش هزینهها تنها یک ابزار برای جذب کاربر نیست، بلکه تلاشی برای تغییر استانداردهای صنعت است. بر اساس بررسی منابع متعدد، دیپسیک برای بهینهسازی حجمهای کاری تکراری، قیمت برخورد با کش (Cache Hit) ورودی را در ۲۶ آوریل ۲۰۲۶ به یکدهم قیمت زمان عرضه کاهش داد. این یعنی هزینه کش برای مدل Flash تنها ۰.۰۰۲۸ دلار برای هر ۱ میلیون توکن است.
این تغییرات با پاکسازی اکوسیستم مدلها همراه شده است. طبق گزارش این شرکت، شناسههای deepseek-chat و deepseek-reasoner بازنشسته میشوند؛ چرا که این دو اکنون به ترتیب حالتهای «غیر استدلالی» و «استدلالی» مدل V4-Flash تبدیل شدهاند.
در حالی که رقابت برای تسلط بر مدلهای استدلالی (Reasoning Models) شدت مییابد، اکنون صنعت منتظر است ببیند آیا رقبایی چون OpenAI یا Anthropic برای جذب مشتریان سازمانی، قیمتهای زیر یک سنت برای کش را پذیرفتهاند یا خیر.
اما این جنگ قیمتها تنها بخشی از ماجراست؛ تأثیر این مدلها بر بازار سختافزاری را در گزارش بعدی بررسی خواهیم کرد.
گام بعدی شما
- اگر از مدلهای قدیمی استفاده میکنید، پیش از ۳۱ می ۲۰۲۶ به V4-Pro مهاجرت کنید تا از تخفیف ۷۵ درصدی بهرهمند شوید.
- پرامپتهای خود را برای بهرهگیری حداکثری از Cache Hit بهینهسازی کنید تا هزینهها را تا ۹۰٪ کاهش دهید.
- برای تسکهای با حجم بالا و سرعت زیاد، مدل V4-Flash را جایگزین مدلهای سنگینتر کنید.




گفتگو