پرش به محتوای اصلی

موضوع

هوش لبه

SLMs, on-device inference, mobile AI, AI PCs

۴۸۰ مقاله منتشر شده

از ۹۶۵ میلیارد دلار تا اولین حمله سایبری خودگردان: چرخش سریع در اکوسیستم AI

شرکت Anthropic برای IPO تریلیون دلاری خود اقدام کرد، در حالی که اولین حمله سایبری کاملاً خودگردان توسط عامل‌های هوش مصنوعی ثبت شد. انویدیا وارد بازار پردازنده‌های PC شد و اپل در…

۵ دقیقه خواندن
چرا ترکیب مدل‌های کوچک، رفتارهای انسانی‌تر از مدل‌های غول‌پیکر می‌سازد؟
آموزش کاربردی

چرا ترکیب مدل‌های کوچک، رفتارهای انسانی‌تر از مدل‌های غول‌پیکر می‌سازد؟

گزارش فنی جدیدی نشان می‌دهد که ترکیب چهار مدل زبانی کوچک از آزمایشگاه‌های مختلف، رفتارهای ارگانیک‌تر و استراتژی‌های اقتصادی پیچیده‌تری را نسبت به یک مدل واحد ایجاد می‌کند. این…

۶ دقیقه خواندن
آموزش کاربردی

Qualcomm AI Hub: مسیر مستقیم استقرار مدل‌های PyTorch روی سخت‌افزار واقعی

توسعه‌دهندگان اکنون می‌توانند مدل‌های PyTorch را به‌جای شبیه‌سازی، مستقیماً روی سخت‌افزارهای واقعی مانند گلکسی S24 بهینه‌سازی و اجرا کنند. این ابزار فاصله میان محیط‌های آزمایشگاهی…

۵ دقیقه خواندن
آموزش کاربردی

کاهش ۶۷ درصدی هزینه‌ی ذخیره‌سازی بردارها با بهینه‌سازی ابعاد مدل OpenAI

کاهش ابعاد بردارها در مدل text-embedding-3-small از ۱۵۳۶ به ۵۱۲، فضای مورد نیاز در دیتابیس‌های برداری را ۶۷٪ کاهش می‌دهد. این تغییر باعث کاهش تأخیر و هزینه‌ی حافظه می‌شود، اما…

۸ دقیقه خواندن