
Asiatek AI: کاهش ۹۷ درصدی هزینه استنتاج در جنوب شرق آسیا
سرویس Asiatek AI با ارائه یک API سازگار با OpenAI در سنگاپور، تأخیر را به زیر ۳۰ میلیثانیه رسانده و هزینهها را برای توسعهدهندگان جنوب شرق آسیا تا ۹۷٪ کاهش داده است. این انتقال…
موضوع
Open-source models, open weights, local hosting, licensing
۴۸۸ مقاله منتشر شده

سرویس Asiatek AI با ارائه یک API سازگار با OpenAI در سنگاپور، تأخیر را به زیر ۳۰ میلیثانیه رسانده و هزینهها را برای توسعهدهندگان جنوب شرق آسیا تا ۹۷٪ کاهش داده است. این انتقال…

هاگینگ فیس و کنسرسیومی از آزمایشگاههای هوش مصنوعی، OpenEnv را به یک پروتکل جامعهمحور برای استانداردسازی محیطهای اجرای عاملها تبدیل کردند. هدف این پروژه حذف مزیت انحصاری…

تجربهی ساخت عامل Vibrisse نشان میدهد که تکیه بر پرامپتها در پروژههای بزرگ شکست میخورد. این پروژه ثابت میکند که برای داشتن عاملهای محلی قابل اعتماد، انضباط معماری مهمتر از…

تجربهی یکماههی توسعهی پروژه Vibrisse نشان میدهد که کدنویسی بر اساس «حس» یا همان وایبکدینگ، در پروژههای بزرگ شکست میخورد. این پروژه راهکار را در معماری ترکیبی محلی-ابری و…

استارتاپ چینی Moonshot AI برای گسترش چتبات Kimi، به دنبال جذب ۱ تا ۲ میلیارد دلار سرمایه با ارزشگذاری ۳۰ میلیارد دلاری است. این جهش در حالی رخ میدهد که جدیدترین مدل این شرکت…

یک تجربه چهارماهه در اتوماسیون بازبینی کد نشان داد که مدلهای زبانی بزرگ بدون داشتن زمینهٔ اختصاصیِ هر پروژه، در محیط تولید شکست میخورند. با تنظیم دقیق یک مدل کوچکتر و…

پروژهی متنباز Sentience محیطی کاملاً محلی برای اجرای ۸۱ ابزار هوش مصنوعی فراهم میکند که نیازی به اشتراک ماهیانه یا ارسال داده به سرورهای خارجی ندارد. این ابزار با استفاده از…

MiniCPM-Desk-Pet یک دستیار هوشمند محلی است که با استفاده از مدل MiniCPM5 مستقیماً روی دسکتاپ اجرا میشود. این ابزار امکان گفتگو و دریافت یادآورها را بهصورت خصوصی و بدون نیاز به…

پلتفرم متنباز ninoxAI با 도입 یک عامل SRE «فقط-خواندنی»، طوفانهای هشدار را به یک حادثه واحد تبدیل کرده و راهکارهای اصلاحی را پیشنهاد میدهد. این ابزار بدون دسترسی به تغییرات…

بهروزرسانیهای جدید در llama.cpp، عامل goose و شاخص turbovec، اجرای هوش مصنوعی محلی را بهینه کردند. این ابزارها به توسعهدهندگان اجازه میدهند عاملهای خودکار و سیستمهای RAG را…

تلاش یک توسعهدهنده برای ساخت یک پت هوشمند بازیساز با مدل Nemotron 30b شکست خورد و منجر به بازگشت به ابزارهای ساده HTML شد. این تجربه نشان میدهد که حتی با استفاده از RAG،…

سیستمهای چندعاملی در CrewAI به دلیل تکرار متنها و جابجایی بین عاملها، هزینههای استنتاج را بالا میبرند. Lynkr با معرفی یک لایهی دروازه و استفاده از حافظه پنهان، این هزینهها…