مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

اگر امروز برای استفاده از GPT-4o هزینه پرداخت می‌کنید، احتمالاً صورت‌حساب ماهانهٔ شما ۶۰٪ بیشتر از مقدار لازم است. یک دانشمند داده به‌تازگی فاش کرد که چگونه با تغییر رویکرد «یک مدل برای همه»، هزینه‌های ۴۲۰۰ دلاری خود را به‌شدت کاهش داده است.

بسیاری از توسعه‌دهندگان با مدل‌های زبانی بزرگ (LLM) — مثل کتابخانه‌داری که میلیاردها صفحه را خوانده و حالا با همان لحن کتاب‌ها جواب می‌دهد — به‌صورت یک ابزار واحد برخورد می‌کنند. اما واقعیت این است که بسیاری از کارهای ساده، که می‌توان آن‌ها را «در سطح تکالیف مدرسه» دانست، با نرخ‌های گران‌قیمت مدل‌های پیشرو صورت می‌گیرند. این ناکارآمدی باعث ایجاد شکاف بزرگی بین نیاز واقعی یک قابلیت در محصول و مبلغی می‌شود که شرکت پرداخت می‌کند.

طبق گزارشی که در ۱۶ ژوئن ۲۰۲۶ منتشر شد، نویسنده توضیح می‌دهد که ۷۳٪ از درخواست‌های عملیاتی او تنها شامل طبقه‌بندی‌های ساده، تولید متون کوتاه یا استخراج داده‌های ساختاریافته بوده است. این وظایف اصلاً به قدرت استدلال مدل‌های پیشرو نیاز نداشتند. او برای شناسایی این موضوع، نمونه‌ای از ۱۰ هزار درخواست را از لاگ‌ها استخراج و آن‌ها را بر اساس نوع وظیفه دسته‌بندی کرد.

همان‌طور که در تحلیل‌های قبلی ما درباره‌ی بهینه‌سازی هزینه‌های استنتاج اشاره کردیم، انتخاب مدل درست، کلید سودآوری در مقیاس است. برای حل این مشکل، توسعه‌دهنده به Global API مهاجرت کرد؛ پلتفرمی که ۱۸۴ مدل را از طریق یک نقطه اتصال (Endpoint) سازگار با OpenAI ارائه می‌دهد. این کار به او اجازه داد بدون بازنویسی کل کد کلاینت، مدل‌ها را جابه‌جا کند. کاتالوگ این سرویس طیف قیمتی گسترده‌ای دارد؛ از ۰.۰۱ دلار تا ۳.۵۰ دلار به‌ازای هر میلیون توکن، بسته به سطح مدل.

شکاف قیمتی

تفاوت قیمت بین مدل‌های پیشرو و اقتصادی بسیار چشمگیر است. بر اساس داده‌های جمع‌آوری‌شده در سال ۲۰۲۶، GPT-4o به‌ازای هر میلیون توکن ورودی ۲.۵۰ دلار و برای خروجی ۱۰ دلار هزینه می‌گیرد و پنجره متنی (Context Window) — یعنی میزان متنی که مدل هم‌زمان در ذهن نگه می‌دارد، شبیه میز کاری که جا برای چند ورق دارد — آن ۱۲۸ هزار توکن است.

در مقابل، جایگزین‌های اقتصادی تخفیفات شدیدی ارائه می‌دهند:

DeepSeek V4 Flash: ورودی ۰.۲۷ / خروجی ۱.۱۰ دلار (پنجره ۱۲۸ هزار)
GLM-4 Plus: ورودی ۰.۲۰ / خروجی ۰.۸۰ دلار (پنجره ۱۲۸ هزار)
Qwen3-32B: ورودی ۰.۳۰ / خروجی ۱.۲۰ دلار (پنجره ۳۲ هزار)
DeepSeek V4 Pro: ورودی ۰.۵۵ / خروجی ۲.۲۰ دلار (پنجره ۲۰۰ هزار)

بنچمارک کیفیت در برابر هزینه

توسعه‌دهنده مجموعه‌ای از ۵۰۰ مسئله را در آزمون‌های MMLU، HumanEval و GSM8K اجرا کرد. در حالی که GPT-4o با میانگین ۸۹.۹٪ پیشتاز بود، مدل‌های اقتصادی میانگین ۸۴.۶٪ را کسب کردند.

نتایج دقیق بنچمارک‌ها به این شرح است:

DeepSeek V4 Pro: میانگین ۸۷.۰٪ (MMLU: ۸۵.۷٪، HumanEval: ۸۸.۱٪، GSM8K: ۸۷.۳٪)
DeepSeek V4 Flash: میانگین ۸۰.۱٪ (MMLU: ۷۸.۲٪، HumanEval: ۸۲.۴٪، GSM8K: ۷۹.۸٪)
Qwen3-32B: میانگین ۷۹.۸٪ (MMLU: ۷۹.۴٪، HumanEval: ۸۱.۲٪، GSM8K: ۷۸.۹٪)
GLM-4 Plus: میانگین ۷۷.۸٪ (MMLU: ۷۶.۱٪، HumanEval: ۷۹.۸٪، GSM8K: ۷۷.۴٪)
GPT-4o: میانگین ۸۹.۹٪ (MMLU: ۸۸.۹٪، HumanEval: ۹۱.۲٪، GSM8K: ۸۹.۷٪)

نکته حیاتی این است که نویسنده دریافت وقتی یک مدل از آستانه ۸۰٪ در بنچمارک عبور می‌کند، رابطه آن با رضایت واقعی کاربر ضعیف می‌شود. در این مورد خاص، جایگزینی مدل‌ها تنها ۰.۳ امتیاز (در مقیاس ۵ امتیازی) از شاخص رضایت مشتری (CSAT) را کاهش داد. این یعنی برای چت‌بات‌ها، خط‌لوله‌های خلاصه‌سازی یا استخراج موجودیت‌ها، تفاوت بین ۸۴.۶٪ و ۸۹.۹٪ عملاً نویز است و تأثیری در تجربه کاربر ندارد.

سازوکار مسیریابی

برای حفظ کیفیت، توسعه‌دهنده یک «طبقه‌بندی‌کننده پیچیدگی» طراحی کرد. این یک پرامپت بسیار کوچک است که روی یک مدل ارزان اجرا می‌شود و تصمیم می‌گیرد پرسش «ساده» است یا «پیچیده».

پرسش‌های ساده به DeepSeek V4 Flash هدایت می‌شوند.
پرسش‌های پیچیده به DeepSeek V4 Pro می‌روند.

این تقسیم ترافیک ۷۰/۳۰ منجر به کاهش ۶۴ درصدی کل هزینه‌ها در مقایسه با حالت تمام-GPT-4o شد. این تغییر از نظر آماری در یک آزمون کای-اسکوئر (Chi-square test) روی توزیع هزینه‌ها معنادار بود. پیاده‌سازی این روش ساده بود، زیرا Global API از رابط OpenAI استفاده می‌کند و تنها نیاز به تغییر URL پایه و چرخش کلید API داشت.

جزئیات فنی پیاده‌سازی

تغییرات کد بسیار اندک بود. توسعه‌دهنده از SDK پایتون OpenAI استفاده کرد و base_url را به https://global-apis.com/v1 تغییر داد و کلید API را جایگزین کرد.

منطق فنی به این صورت است:

تابع مسیریابی: تابعی به نام route_request ایجاد شد تا منطق هدایت را مدیریت کند. اگر پیچیدگی «بالا» (high) تشخیص داده شود، سیستم مدل deepseek-ai/DeepSeek-V4-Pro را فراخوانی می‌کند؛ در غیر این صورت، به صورت پیش‌فرض مدل deepseek-ai/DeepSeek-V4-Flash اجرا می‌گردد.
تنظیم استریم: توسعه‌دهنده از پارامتر stream=True در متد chat.completions.create استفاده کرد. این کار به سیستم اجازه می‌دهد تکه‌های محتوا را به‌محض تولید ارسال کند.

عملکرد و تأخیر

تأخیر (Latency) برای اکثر کاربردها قابل قبول بود. مدل‌های اقتصادی به‌طور میانگین ۱.۲ ثانیه زمان تا اولین توکن (TTFT) داشتند و سرعت تولید آن‌ها ۳۲۰ توکن در ثانیه بود. این سرعت شاید برای دستیارهای کدنویسی تعاملی یا سیستم‌های صوتی لحظه‌ای که هر ۱۰۰ میلی‌ثانیه در آن‌ها حیاتی است، کند باشد، اما برای کارهای دسته‌ای (Batch) و کارهای نزدیک به لحظه‌ای کاملاً مناسب است.

برای بهینه‌سازی بیشتر، دو استراتژی فنی خاص به کار گرفته شد:

کش معنایی (Semantic Caching): با استفاده از بردار معنایی (Embedding) — مثل کارت معرفی عددی برای هر واژه که می‌گوید این کلمه همسایه‌ی چه کلمات دیگری است — و دیتابیس Redis، نرخ پاسخ از کش پس از دو هفته به ۴۰٪ رسید. این موضوع یک همبستگی خطی بین نرخ命中 کش و کاهش هزینه‌ها ایجاد می‌کند.
استریم پاسخ‌ها: این کار تأخیر دریافت‌شده توسط کاربر را به ۲۰۰ تا ۴۰۰ میلی‌ثانیه رساند. همچنین به سیستم اجازه می‌دهد در صورت قطع اتصال کاربر یا زدن دکمه بازگشت، استریم را قطع کرده و از پرداخت هزینه برای توکن‌های خروجی اضافی جلوگیری کند.

ریاضیات دنیای واقعی

برای یک حجم کاری متوسط (۵۰ میلیون توکن ورودی / ۲۰ میلیون خروجی)، هزینه‌ها این‌گونه تغییر می‌کنند:

GPT-4o: ۳۲۵.۰۰ دلار (پایه: ۱۲۵ دلار ورودی / ۲۰۰ دلار خروجی)
DeepSeek V4 Pro: ۷۱.۵۰ دلار (۷۸٪ کاهش: ۲۷.۵۰ دلار ورودی / ۴۴ دلار خروجی)
DeepSeek V4 Flash: ۳۵.۵۰ دلار (۸۹٪ کاهش: ۱۳.۵۰ دلار ورودی / ۲۲ دلار خروجی)
Qwen3-32B: ۳۹.۰۰ دلار (۸۸٪ کاهش: ۱۵ دلار ورودی / ۲۴ دلار خروجی)
GLM-4 Plus: ۲۶.۰۰ دلار (۹۲٪ کاهش: ۱۰ دلار ورودی / ۱۶ دلار خروجی)

این داده‌ها نشان می‌دهند که برای اکثر قابلیت‌های SaaS، «کف کیفیت» بسیار بالاتر از تصور توسعه‌دهندگان است. کاهش ترکیبی ۴۰ تا ۶۵ درصدی هزینه، سناریوی واقع‌بینانه در صورت مسیریابی هوشمند بین سطوح مختلف مدل‌ها است.

تجربیات عملی از میدان نبرد

پس از ۱۲ هفته اجرا با حجم نمونه ۱۸۴، چند نکته کلیدی استخراج شد:

لایه بندی بر اساس پیچیدگی: این مهم‌ترین اهرم است. لایه ارزان ۷۳٪ ترافیک را مدیریت می‌کند و لایه ممتاز بقیه را.
پایش مستمر کیفیت: نویسنده ۱٪ از تمامی پاسخ‌ها را نمونه‌برداری کرده و با یک مدل داور سبک (LLM-as-judge) در برابر یک مجموعه داده جداشده (held-out set) بررسی می‌کند تا هرگونه افت کیفیت را شناسایی کند.
پیاده‌سازی جایگزین (Fallback): برای مدیریت محدودیت‌های نرخ درخواست (Rate Limits)، یک ارائه‌دهنده ثانویه تعریف شده است. اگر مدل‌های ارزان Global API به محدودیت بخورند، درخواست‌ها به نقطه اتصال دیگری منتقل می‌شوند تا از قطع سرویس جلوگیری شود. این بخش تقریباً ۳۰ خط به کد اضافه کرد.
کش تهاجمی: هر پاسخ کش‌شده، توکنی است که دیگر نیازی به پرداخت هزینه برای آن نیست.
استریم پاسخ‌ها: علاوه بر تجربه کاربر، استریم اجازه می‌دهد تولید در سمت مدل زودتر متوقف شود و از پرداخت هزینه برای توکن‌های خروجی استفاده‌نشده جلوگیری شود.

در نهایت باید به محدودیت‌های این تحلیل توجه کرد. بنچمارک‌ها بر اساس ۵۰۰ مسئله برای هر ارزیابی بودند. اگرچه برای رتبه‌بندی مفید هستند، اما انحراف معیار در آن‌ها معنا دارد. برای مثال، تفاوت ۹ درصدی بین GLM-4 Plus و DeepSeek V4 Pro در برخی وظایف عملیاتی محسوس است.

برای شروع، نویسنده پیشنهاد می‌کند یک پایلوت روی داده‌های داخلی اجرا کنید. Global API حدود ۱۰۰ اعتبار رایگان برای شروع می‌دهد؛ نویسنده از ۴۰ اعتبار برای پایلوت خود استفاده کرد تا چیزهایی بیاموزد که از خواندن مقالات بنچمارک به دست نمی‌آمد.

این تغییر استراتژی، بدون قربانی کردن تجربه کاربر، به سودآوری کمک می‌کند و هوش مصنوعی را از یک مرکز هزینه متلاطم به یک هزینه عملیاتی پیش‌بینی‌پذیر تبدیل می‌کند. برای خواننده، این بدان معناست که موثرترین راه برای مقیاس‌بندی یک محصول AI، یافتن ارائه‌دهنده ارزان‌تر نیست، بلکه پیاده‌سازی یک لایه مسیریابی است که پیچیدگی وظیفه را با هزینه مدل تطبیق دهد.

اگر یک استک LLM عملیاتی را مدیریت می‌کنید، اولین قدم شما باید یک حسابرسی داده‌محور از لاگ‌های درخواست باشد تا درصد وظایف «ساده» که در حال حاضر روی مدل‌های ممتاز اجرا می‌شوند را بیابید.

گام بعدی شما

لاگ‌های درخواست‌های خود را تحلیل کنید تا درصد وظایف «ساده» که روی مدل‌های گران اجرا می‌شوند را بیابید.
یک طبقه‌بندی‌کننده پیچیدگی (Complexity Classifier) ساده با یک مدل ارزان پیاده کنید.
مدل‌های اقتصادی مانند DeepSeek V4 Flash را برای وظایف استخراج داده و خلاصه‌سازی تست کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

این گزارش با خط‌لولهٔ خودکار دات‌هوش از منابع معتبر جهانی تدوین و زیر نظر تحریریه منتشر شده است. روش کار ما

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

اخبار روزانه، معرفی ابزارها و مدل‌ها، و آموزشِ کار با هوش مصنوعی؛ همیشه با این پرسش که از ایران چه چیزی کار می‌کند و چه چیزی نه.

شکاف قیمتی

در مقابل، جایگزین‌های اقتصادی تخفیفات شدیدی ارائه می‌دهند:

DeepSeek V4 Flash: ورودی ۰.۲۷ / خروجی ۱.۱۰ دلار (پنجره ۱۲۸ هزار)
GLM-4 Plus: ورودی ۰.۲۰ / خروجی ۰.۸۰ دلار (پنجره ۱۲۸ هزار)
Qwen3-32B: ورودی ۰.۳۰ / خروجی ۱.۲۰ دلار (پنجره ۳۲ هزار)
DeepSeek V4 Pro: ورودی ۰.۵۵ / خروجی ۲.۲۰ دلار (پنجره ۲۰۰ هزار)

بنچمارک کیفیت در برابر هزینه

نتایج دقیق بنچمارک‌ها به این شرح است:

DeepSeek V4 Pro: میانگین ۸۷.۰٪ (MMLU: ۸۵.۷٪، HumanEval: ۸۸.۱٪، GSM8K: ۸۷.۳٪)
DeepSeek V4 Flash: میانگین ۸۰.۱٪ (MMLU: ۷۸.۲٪، HumanEval: ۸۲.۴٪، GSM8K: ۷۹.۸٪)
Qwen3-32B: میانگین ۷۹.۸٪ (MMLU: ۷۹.۴٪، HumanEval: ۸۱.۲٪، GSM8K: ۷۸.۹٪)
GLM-4 Plus: میانگین ۷۷.۸٪ (MMLU: ۷۶.۱٪، HumanEval: ۷۹.۸٪، GSM8K: ۷۷.۴٪)
GPT-4o: میانگین ۸۹.۹٪ (MMLU: ۸۸.۹٪، HumanEval: ۹۱.۲٪، GSM8K: ۸۹.۷٪)

سازوکار مسیریابی

پرسش‌های ساده به DeepSeek V4 Flash هدایت می‌شوند.
پرسش‌های پیچیده به DeepSeek V4 Pro می‌روند.

جزئیات فنی پیاده‌سازی

منطق فنی به این صورت است:

تابع مسیریابی: تابعی به نام route_request ایجاد شد تا منطق هدایت را مدیریت کند. اگر پیچیدگی «بالا» (high) تشخیص داده شود، سیستم مدل deepseek-ai/DeepSeek-V4-Pro را فراخوانی می‌کند؛ در غیر این صورت، به صورت پیش‌فرض مدل deepseek-ai/DeepSeek-V4-Flash اجرا می‌گردد.
تنظیم استریم: توسعه‌دهنده از پارامتر stream=True در متد chat.completions.create استفاده کرد. این کار به سیستم اجازه می‌دهد تکه‌های محتوا را به‌محض تولید ارسال کند.

عملکرد و تأخیر

برای بهینه‌سازی بیشتر، دو استراتژی فنی خاص به کار گرفته شد:

کش معنایی (Semantic Caching): با استفاده از بردار معنایی (Embedding) — مثل کارت معرفی عددی برای هر واژه که می‌گوید این کلمه همسایه‌ی چه کلمات دیگری است — و دیتابیس Redis، نرخ پاسخ از کش پس از دو هفته به ۴۰٪ رسید. این موضوع یک همبستگی خطی بین نرخ命中 کش و کاهش هزینه‌ها ایجاد می‌کند.
استریم پاسخ‌ها: این کار تأخیر دریافت‌شده توسط کاربر را به ۲۰۰ تا ۴۰۰ میلی‌ثانیه رساند. همچنین به سیستم اجازه می‌دهد در صورت قطع اتصال کاربر یا زدن دکمه بازگشت، استریم را قطع کرده و از پرداخت هزینه برای توکن‌های خروجی اضافی جلوگیری کند.

ریاضیات دنیای واقعی

برای یک حجم کاری متوسط (۵۰ میلیون توکن ورودی / ۲۰ میلیون خروجی)، هزینه‌ها این‌گونه تغییر می‌کنند:

GPT-4o: ۳۲۵.۰۰ دلار (پایه: ۱۲۵ دلار ورودی / ۲۰۰ دلار خروجی)
DeepSeek V4 Pro: ۷۱.۵۰ دلار (۷۸٪ کاهش: ۲۷.۵۰ دلار ورودی / ۴۴ دلار خروجی)
DeepSeek V4 Flash: ۳۵.۵۰ دلار (۸۹٪ کاهش: ۱۳.۵۰ دلار ورودی / ۲۲ دلار خروجی)
Qwen3-32B: ۳۹.۰۰ دلار (۸۸٪ کاهش: ۱۵ دلار ورودی / ۲۴ دلار خروجی)
GLM-4 Plus: ۲۶.۰۰ دلار (۹۲٪ کاهش: ۱۰ دلار ورودی / ۱۶ دلار خروجی)

تجربیات عملی از میدان نبرد

پس از ۱۲ هفته اجرا با حجم نمونه ۱۸۴، چند نکته کلیدی استخراج شد:

لایه بندی بر اساس پیچیدگی: این مهم‌ترین اهرم است. لایه ارزان ۷۳٪ ترافیک را مدیریت می‌کند و لایه ممتاز بقیه را.
پایش مستمر کیفیت: نویسنده ۱٪ از تمامی پاسخ‌ها را نمونه‌برداری کرده و با یک مدل داور سبک (LLM-as-judge) در برابر یک مجموعه داده جداشده (held-out set) بررسی می‌کند تا هرگونه افت کیفیت را شناسایی کند.
پیاده‌سازی جایگزین (Fallback): برای مدیریت محدودیت‌های نرخ درخواست (Rate Limits)، یک ارائه‌دهنده ثانویه تعریف شده است. اگر مدل‌های ارزان Global API به محدودیت بخورند، درخواست‌ها به نقطه اتصال دیگری منتقل می‌شوند تا از قطع سرویس جلوگیری شود. این بخش تقریباً ۳۰ خط به کد اضافه کرد.
کش تهاجمی: هر پاسخ کش‌شده، توکنی است که دیگر نیازی به پرداخت هزینه برای آن نیست.
استریم پاسخ‌ها: علاوه بر تجربه کاربر، استریم اجازه می‌دهد تولید در سمت مدل زودتر متوقف شود و از پرداخت هزینه برای توکن‌های خروجی استفاده‌نشده جلوگیری شود.

گام بعدی شما

لاگ‌های درخواست‌های خود را تحلیل کنید تا درصد وظایف «ساده» که روی مدل‌های گران اجرا می‌شوند را بیابید.
یک طبقه‌بندی‌کننده پیچیدگی (Complexity Classifier) ساده با یک مدل ارزان پیاده کنید.
مدل‌های اقتصادی مانند DeepSeek V4 Flash را برای وظایف استخراج داده و خلاصه‌سازی تست کنید.

اما داستان سخت‌افزاری این تحول حتی شگفت‌انگیزتر است — به تحلیل ما درباره‌ی تراشه‌های Blackwell مراجعه کنید.

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

شکاف قیمتی

بنچمارک کیفیت در برابر هزینه

سازوکار مسیریابی

جزئیات فنی پیاده‌سازی

عملکرد و تأخیر

ریاضیات دنیای واقعی

تجربیات عملی از میدان نبرد

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

شکاف قیمتی

بنچمارک کیفیت در برابر هزینه

سازوکار مسیریابی

جزئیات فنی پیاده‌سازی

عملکرد و تأخیر

ریاضیات دنیای واقعی

تجربیات عملی از میدان نبرد

گام بعدی شما

منابع

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

شکاف قیمتی

بنچمارک کیفیت در برابر هزینه

سازوکار مسیریابی

جزئیات فنی پیاده‌سازی

عملکرد و تأخیر

ریاضیات دنیای واقعی

تجربیات عملی از میدان نبرد

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران

مدل‌های ارزان در برابر مدل‌های سطح‌بالا در ۷۳٪ حجم کاری مشابه

شکاف قیمتی

بنچمارک کیفیت در برابر هزینه

سازوکار مسیریابی

جزئیات فنی پیاده‌سازی

عملکرد و تأخیر

ریاضیات دنیای واقعی

تجربیات عملی از میدان نبرد

گام بعدی شما

منابع

مقاله‌های مرتبطهمه ←

«تهدید امنیت ملی»؛ هشدار کشورهای G7 به انحصار مدل‌های آمریکایی

هگینگ‌فیس با استاندارد ARD جست‌وجوی ابزارها برای عامل‌ها را خودکار کرد

«پیش‌بینی مسیر از طریق متن»؛ دستاورد جدید مؤسسه AllenAI در فضای سه‌بعدی

گفتگو

بسته‌ی هفتگی دات‌هوش

راهنماهای دات‌هوش

مدل‌ها و ابزارهای مرتبط

اصطلاحات این مطلب

راهنمای فارسی هوش مصنوعی — با نگاه به ایران