موضوع

استدلال

Chain-of-thought, reasoning models (o-series, R-series), test-time compute

۶۰۷ مقاله منتشر شده

ساخت تری‌فورت: چرا یادگیری ماشین خالص را کنار گذاشتیم و موتور هوشمندی ساخت‌وساز ساختیم

Tri-Fort تخمین هزینه‌های ساخت‌ساز را از یادگیری ماشین به موتور ترکیبی تغییر داد

تیم Tri-Fort پس از کشف اینکه داده‌های آموزشی آن‌ها صرفاً تخمین‌های قبلی بوده‌اند و نه هزینه‌های واقعی، معماری خود را تغییر داد. آن‌ها اکنون از یک مدل ترکیبی استفاده می‌کنند که…

۶ دقیقه خواندن

نوام شازیری، رهبر مشترک جمینی گوگل، پس از دو سال بازگشت به این شرکت، به اوپن‌ای‌آی پیوست.

اخبار کوتاه روزانههفتهٔ گذشته

درون جابه‌جایی نوآم شازیر از گوگل به OpenAI

نوآم شازیر، یکی از نویسندگان مقاله اثرگذار Attention Is All You Need، گوگل را ترک کرد تا به OpenAI بپیوندد. این جابه‌جایی استراتژیک در حالی رخ می‌دهد که گوگل برای بهبود مدل‌های…

۱ دقیقه خواندن۴

کیوون محلی نسخه ضعیف‌تر اوپوس نیست، ابزاری متفاوت است

داستان‌ها و مصاحبه‌هاهفتهٔ گذشته

شکاف اعتماد در کدنویسی: مدل‌های محلی Qwen در تکالیف پیچیده شکست می‌خورند

تست‌های عملی روی مدل‌های محلی Qwen نشان می‌دهد که با وجود مزیت حریم خصوصی، این مدل‌ها در مدیریت پروژه‌های کدنویسی طولانی دچار «حلقه‌های تکرار» می‌شوند. این یافته‌ها فاصلهٔ…

۱۰ دقیقه خواندن

معیار ارزیابی ۷۵۰ وظیفه‌ای OpenAI برای سنجش هوش مصنوعی در پژوهش‌های علوم زیستی واقعی با راهنمای کارشناسی

تحلیل و بررسی تخصصیهفتهٔ گذشته

LifeSciBench: مدل‌های برتر زیست‌شناسی در ۶۴٪ تکالیف پژوهشی شکست خوردند

OpenAI با معرفی محک LifeSciBench نشان داد که حتی پیشرفته‌ترین مدل‌های تخصصی زیست‌شناسی در مواجهه با مسائل پیچیده پژوهشی ناتوان‌اند. این داده‌ها حاکی از شکاف عمیق میان حفظ اطلاعات…

۶ دقیقه خواندن

فرار از باغ‌های حصاردار: ماجراجویی با API دیپ‌سیک

آموزش کاربردی۲ هفته پیش

DeepSeek هزینه استنتاج مدل‌های زبانی را ۷۴٪ کاهش داد

توسعه‌دهندگان اکنون می‌توانند با استفاده از SDKهای استاندارد OpenAI، مدل‌های DeepSeek را بدون تغییر در کد سازگار کنند. این انتقال باعث کاهش شدید هزینه‌های عملیاتی می‌شود در حالی…

۹ دقیقه خواندن

مینی‌مکس M3: اولین مدل متن‌باز برای یکپارچه‌سازی سه مرز دانش هوش مصنوعی

اخبار کوتاه روزانه۲ هفته پیش

مدل M3 از MiniMax با پنجره متنی یک میلیون توکنی عرضه شد

شرکت MiniMax مدل M3 را با قابلیت‌های کدنویسی پیشرفته و پنجره متنی یک میلیون توکنی به‌صورت وزن‌های باز منتشر کرد. این مدل با ادغام قابلیت‌های چندوجهی و استدلال، رقابت مستقیمی با…

۲ دقیقه خواندن

آمازون، انویدیا و AMD ۳۱۰ میلیون دلار روی استارتاپ هوش مصنوعی سازنده مدل‌های سه‌بعدی جهان سرمایه‌گذاری کردند.

اخبار کوتاه روزانه۲ هفته پیش

سرمایه‌گذاری سری B: ۳۱۰ میلیون دلار برای شبیه‌سازی فیزیک در Odyssey

استارتاپ Odyssey با جذب ۳۱۰ میلیون دلار سرمایه در سری B، بر توسعه «مدل‌های جهانی» برای شبیه‌سازی قوانین فیزیک تمرکز می‌کند. این دور سرمایه‌گذاری با حمایت انویدیا، ای‌ام‌دی و…

۱ دقیقه خواندن

شبکه عصبی ساخته‌شده از بز در Age of Empires II برای نقد علم هوش مصنوعی

تحلیل و بررسی تخصصی۲ هفته پیش

درون آزمایش مایکروسافت برای به چالش کشیدن منطقِ آگاهی در مدل‌های زبانی

یک پژوهشگر مایکروسافت با ساخت یک شبکه عصبی عملیاتی در محیط بازی Age of Empires II، نشان داد که «آگاهی» در هوش مصنوعی تنها یک توهم ناشی از بسته‌بندی ظاهری است. این مطالعه هشدار…

۵ دقیقه خواندن

هوش مصنوعی شیمیدان تقریباً خودمختار، واکنش پیچیده‌ای در شیمی دارویی را بهبود می‌بخشد.

اخبار کوتاه روزانه۲ هفته پیش

GPT-5.4 بازدهی واکنش‌های شیمیایی دشوار را افزایش داد

اوپن‌ای‌آی با ترکیب مدل GPT-5.4 و آزمایشگاه خودکار Molecule.one توانست یک واکنش پیچیده در شیمی دارویی را بهینه کند. این سامانه با شناسایی یک افزودنی غیرمنتظره، بازدهی تولید…

۷ دقیقه خواندن

مهندسی از کجا آغاز می‌شود: تصویری از فضای کاری یک مهندس با ابزارها و نقشه‌های فنی

زندگی با AI۲ هفته پیش

«از پیاده‌سازی به قضاوت»؛ مسیر بقای مهندسان ارشد در عصر AI

هوش مصنوعی هزینه پیاده‌سازی نرم‌افزار را به شدت کاهش داده و کدنویسی را به یک فرآیند ترجمه ساده تبدیل کرده است. برای حفظ ارزش شغلی، مهندسان ارشد باید از «ساختن سریع» به سمت «قضاوت…

۴ دقیقه خواندن

نمودار معماری سیستم TREX: اجرای کد و تولید مصنوعات برای بازبینی هوشمند کد

آموزش کاربردی۲ هفته پیش

تحلیل استاتیک در برابر اجرای پویا برای شناسایی باگ‌های رابط کاربری

شرکت Greptile لایه‌ی اجرایی TREX را معرفی کرد تا بررسی کدهای AI را از خواندن ساده به اجرای واقعی تغییر دهد. این رویکرد اجازه می‌دهد خطاهای منطقی و پس‌روی‌های رابط کاربری که در…

۷ دقیقه خواندن

پرامانا لبز ۲۷ میلیون دلار برای تأیید رسمی هوش مصنوعی جذب کرد

اخبار کوتاه روزانه۲ هفته پیش

حذف توهمات مدل‌های زبانی در حوزه‌های حساس با تکیه بر تایید رسمی

استارت‌آپ Pramaana Labs با جذب ۲۷ میلیون دلار سرمایه، در تلاش است تا با ادغام اثبات‌های ریاضی در مدل‌های زبانی، خطاهای بحرانی در حوزه‌های حقوق و پزشکی را به صفر برساند.

۲ دقیقه خواندن