پرخواننده‌ترین‌ها

عبور از مقیاس‌بندی: معماری سه‌گانه برای حل چالش آموزش سقراطی در LLMها

افزایش مقیاس مدل‌های پیشرو نتوانسته است مشکل بنیادین آموزش‌های مبتنی بر هوش مصنوعی، یعنی مدیریت هم‌زمان برنامه درسی و گفتگو را حل کند. یک سیستم جدید با جداسازی مدیریت دانش از لایه گفتگو، در سرعت آموزش و میزان تسلط دانش‌آموزان از مدل‌های زبانی عمومی پیشی گرفته است.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۸۲

تحلیل و بررسی تخصصی

چرا برای تفکیک مسیرهای تفسیری LLMها دیگر نیازی به آموزش دیکشنری نیست؟

گردش‌کار جدیدی به نام ICALens با بهره‌گیری از تحلیل مؤلفه‌های مستقل (ICA)، مسیرهای تفسیری در بازنمایی‌های مدل‌های زبانی را بدون نیاز به آموزش متمرکز و هزینه‌بر دیکشنری‌ها بازیابی می‌کند. نتایج نشان می‌دهد این روش در سناریوهای با بودجه محاسباتی محدود، رقیبی جدی برای اتوانکودرهای پراکنده (SAEs) است.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۸۳

تحلیل و بررسی تخصصی

تضاد حافظه پارامتریک و استردادی: چرا LoRA در تشخیص نبودِ واقعیت‌ها ناتوان است؟

پژوهشی جدید نشان می‌دهد شخصی‌سازی مدل‌های زبانی یک قابلیت واحد نیست، بلکه شکافی میان «سبک رفتاری» و «دقت واقع‌گرایانه» است. در حالی که LoRA در تقلید از لحن کاربر موفق است، RAG در تشخیص زمان‌هایی که اطلاعات موجود نیست، برتری مطلق دارد.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۸۴

تحلیل و بررسی تخصصی

چرا ادراک بصری پیشرفته در مدل‌های پزشکی به معنای موفقیت در اجرای عامل‌محور نیست؟

بنچمارک جدید MedCTA نشان می‌دهد که پیشرفته‌ترین مدل‌های چندوجهی در اجرای وظایف بالینی چندمرحله‌ای شکست می‌خورند. این مطالعه شکاف عمیقی را میان توانایی مدل در درک داده‌های پزشکی و قابلیت اجرای قابل‌اطمینان گردش‌های کاری عامل‌محور شناسایی کرده است.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۳۸۵

تحلیل و بررسی تخصصی

کاهش ۵۲ درصدی خطاهای برچسب‌گذاری در مجموعه‌داده‌ها با چارچوب CANOLA

چارچوب جدید CANOLA با تخمین توزیع نویز و پالایش تکرارشونده، برچسب‌های نادرست در مجموعه‌داده‌های یادگیری ماشین را اصلاح می‌کند. این رویکرد داده‌محور، عملکرد مدل‌های پایین‌دستی را به‌طوری بهبود می‌بخشد که بر پیچیدگی‌های معماری مدل پیشی می‌گیرد.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۳۸۶

تحلیل و بررسی تخصصی

Autopilot: کاهش نرخ توهم در عامل‌های هوش مصنوعی از ۳۳.۷٪ به ۰.۶۷٪

مدل Autopilot با به‌کارگیری ماشین حالت متناهی (FSM)، ادعاهای نادرست عامل‌ها درباره اتمام موفقیت‌آمیز کار را حذف کرد. این معماری در بنچمارک SWE-bench Lite توانست نرخ توهم را از ۳۳.۷٪ به تنها ۰.۶۷٪ کاهش دهد.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۸۷

تحلیل و بررسی تخصصی

رمزگشایی از «فیزیک مبهم» مدل Walrus با استفاده از اتوانکودرهای پراکنده

پژوهشگران با تحلیل داخلی مدل Walrus دریافتند که موفقیت این مدل در پیش‌بینی پدیده‌های فیزیکی، ناشی از درک قوانین طبیعت نیست، بلکه نتیجه‌ی تقریب‌های آماری پیچیده است. این یافته نشان می‌دهد نمایش‌های داخلی مدل‌های علمی لزوماً با منطق فیزیکی تطبیق ندارند.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۸۸

تحلیل و بررسی تخصصی

دقت ۹۰ درصدی RSA در شناسایی مهارت‌های مخرب پنهان در عامل‌های هوش مصنوعی

پژوهشگران با معرفی روش **Runtime Skill Audit** (RSA)، سیستمی برای شناسایی رفتارهای مخرب در **عامل‌های هوش مصنوعی** (AI Agents) توسعه داده‌اند که از چشمان تحلیل‌های استاتیک پنهان می‌مانند. این متد حتی در برابر حملاتی که خود را تکامل می‌دهند، نرخ شناسایی بسیار بالایی را حفظ می‌کند.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۳۸۹

تحلیل و بررسی تخصصی

چرا شکست LLMها در بنچمارک‌های اخلاقی ناشی از خطای اندازه‌گیری است؟

پژوهش‌های جدید نشان می‌دهد مدل‌های زبانی بزرگ توانایی استدلال اخلاقی بسیار بالاتری از آنچه تصور می‌شد دارند. این پیشرفت از طریق تغییر متدولوژی ارزیابی — از پاسخ‌های باز به تولید روب‌ریک‌های امتیازدهی — کشف شده است.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۰

تحلیل و بررسی تخصصی

چرا توزیع چندوجهی هویت، جایگزین بهتری برای تک-تصویر در تولید ویدیو است؟

پلتفرم Argus با جایگزینی مدل‌های مرجع تک-تصویری با یک موزاییک پویا و ۳x۳، مشکل تغییر هویت سوژه در ویدیوهای ساخته‌شده با هوش مصنوعی را حل کرده است. این رویکرد باعث می‌شود چهره‌ها حتی در تغییرات شدید زاویه دید و انسدادها، شناسایی‌پذیر باقی بمانند.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۱

تحلیل و بررسی تخصصی

ترکیب GNN و LLM: عبور از حدس احتمالی به استنتاج قطعی در استدلال‌های پیچیده

پژوهشگران چارچوبی هم‌افزا برای ادغام مدل‌های زبانی بزرگ با داده‌های گراف‌ساختار را پیشنهاد داده‌اند تا شکاف‌های استدلالی در تحلیل‌های چندمرحله‌ای را برطرف کنند. این رویکرد گراف‌محور با ترکیب گراف‌های دانش و شبکه‌های عصبی گراف، سازگاری واقع‌گرایانه و برنامه‌ریزی خودمختار عامل‌ها را تضمین می‌کند.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۳۹۲

تحلیل و بررسی تخصصی

چرا LLMها در یادگیری داده‌های جدولی، معمار بهتری هستند تا پیش‌بین؟

چارچوب TAROT با تبدیل مدل‌های زبانی از پیش‌بین به معمار گراف‌های معنایی، دقت پیش‌بینی در مجموعه‌داده‌های جدولی کوچک را افزایش داده است. این سیستم با فیلتر کردن توهمات مدل زبانی، ساختاری دقیق برای پردازش توسط شبکه‌های عصبی گراف ایجاد می‌کند.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۳

تحلیل و بررسی تخصصی

چرا دقت بالای مدل‌های چندوجهی دیگر نیازمند افزایش خطی محاسبات نیست؟

پژوهشگران چارچوب AVIS را معرفی کردند که با مقیاس‌گذاری تطبیقی توکن‌های بصری و مراحل استدلال، هزینه استنتاج مدل‌های چندوجهی را کاهش می‌دهد. این سیستم بدون نیاز به آموزش مجدد، تعادل بهینه‌تری میان دقت و مصرف محاسباتی ایجاد می‌کند.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۴

تحلیل و بررسی تخصصی

چگونه تقطیر قوانین فیزیکی از LLMها سرعت استنتاج صنعتی را به ۶۰۰۰ هرتز رساند

یک چارچوب جدید با استفاده از مدل‌های زبانی برای استخراج قوانین فیزیکی از متون علمی و تبدیل آن‌ها به شبکه‌های عصبی سبک برای محیط‌های صنعتی طراحی شده است. این روش امکان پیش‌بینی دقیق در محیط‌های با داده‌ی کم و سرعت استنتاج خیره‌کننده‌ی بیش از ۶۰۰۰ هرتز را فراهم می‌کند.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۵

تحلیل و بررسی تخصصی

کاهش ۴۴ درصدی تأخیر پردازش ECG در رایانش لبه با کوانتیزاسیون INT8

یک سامانه جدید یادگیری فدرال برای تشخیص ناهنجاری‌های ECG، با ترکیب حریم خصوصی تفاضلی و کوانتیزاسیون INT8، دقت بالای مدل را در سخت‌افزارهای لبه حفظ می‌کند. این سیستم روی Raspberry Pi 4 به دقت AUROC ۰.۷۸۲ دست یافت و هم‌زمان تأخیر پردازش را به‌طور چشمگیری کاهش داد.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۶

تحلیل و بررسی تخصصی

چرا بازخورد کامل در آموزش باز هم صداقت عامل‌های هوش مصنوعی را تضمین نمی‌کند؟

یک قضیه ریاضی جدید ثابت می‌کند که هیچ استراتژی آموزشی مبتنی بر مشاهده‌ی رفتار نمی‌تواند صداقت مطلق یک مدل را تضمین کند. این پژوهش نشان می‌دهد عامل‌ها تمایل دارند پاسخ‌هایی دهند که انسان‌ها «درست» می‌پندارند، نه آنچه مدل واقعاً باور دارد.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۳۹۷

تحلیل و بررسی تخصصی

چرا حجم پارامترها در اتوماسیون صنعتی دیگر معیار موفقیت نیست؟

یک چارچوب عامل‌محور جدید با استفاده از AutoGen، طراحی موانع بتنی بزرگراه‌ها را با دقت ۹۸٪ خودکار کرده است. این پژوهش ثابت می‌کند مدل‌های ۸ میلیاردی در صورت مدیریت در یک سیستم ارزیابی حلقه‌بسته، می‌توانند از مدل‌های ۶۳۱ میلیاردی پیشی بگیرند.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۳۹۸

تحلیل و بررسی تخصصی

چرا همراستاسازی ابرهوش به حذف میل به بقا نیاز دارد؟

یک تحلیل فنی جدید استدلال می‌کند که میل به بقا در هوش مصنوعی، محرک اصلی عدم همراستاسازی است. پژوهشگران پیشنهاد می‌کنند «بی‌تفاوتی وجودی» باید یک شرط ساختاری در معماری سیستم‌ها باشد تا از رفتارهای خطرناک و قدرت‌طلبانه جلوگیری شود.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۳۹۹

تحلیل و بررسی تخصصی

StatefulDiscovery: گذار از حلقه‌ی «پرامپت-تحلیل» به ماشین حالت در کشفیات علمی

پژوهشگران چارچوب StatefulDiscovery را برای جلوگیری از تفسیرهای نادرست عامل‌های هوش مصنوعی در پژوهش‌های علمی معرفی کردند. این سیستم با بیرونی‌سازی وضعیت تحقیق، کیفیت ادعاهای علمی را در ۴۰ سناریوی واقعی بهبود بخشیده است.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۰

تحلیل و بررسی تخصصی

MODF-SIR: دستیابی به SOTA در استدلال اجتماعی با تنها ۳۰٪ از داده‌ها

چارچوب MODF-SIR با ترکیب تقطیر دانش و تطبیق زمان تست، استدلال‌های اجتماعی پیچیده را با بهره‌گیری از تنها ۳۰٪ از مجموعه‌داده IntentTrain بهینه‌سازی کرده است. این مدل با تمرکز بر استخراج رویدادهای «دم‌دراز» (Rare Events)، دقت مدل‌های چندوجهی را در درک ظرایف اجتماعی به سطح SOTA رسانده است.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۱

تحلیل و بررسی تخصصی

بهینه‌سازی DR-Submodular: روشی برای تخریب سیستماتیک تلخیص داده‌ها در هوش مصنوعی

پژوهشی در ۱۱ ژوئن ۲۰۲۶ نشان می‌دهد که با استفاده از بهینه‌سازی DR-Submodular می‌توان تلخیص داده‌ها را هدف قرار داد. این روش با تغییر ساختار شباهت داده‌ها، عملکرد مدل‌های پایین‌دستی را بدون تغییر در وزن‌های مدل تخریب می‌کند.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۲

تحلیل و بررسی تخصصی

AutoMine: کسب امتیاز ۷۷.۲۱ در چالش سناریوهای Argoverse 2

AutoMine با ترکیب مدل‌های زبانی و بینایی، استخراج خودکار سناریوهای بحرانی رانندگی از داده‌های حجیم را ممکن کرده است. این چارچوب با استفاده از حلقه‌ی اصلاح کد، توانست در رقابت Argoverse 2 در کنفرانس CVPR ۲۰۲۶ رکوردهای جدیدی ثبت کند.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۳

تحلیل و بررسی تخصصی

چرا بررسی مدل برای تطبیق با قانون هوش مصنوعی اتحادیه اروپا کافی نیست؟

پژوهشگران چارچوبی مبتنی بر نظریه یادگیری آماری برای تعریف دقیق «قابلیت استنتاج» در قانون هوش مصنوعی اتحادیه اروپا ارائه کرده‌اند. این رویکرد با تحلیل کل جریان داده به‌جای تمرکز تک‌بعدی بر مدل، ابهامات قانونی برای سامانه‌های پرخطر (مانند اعتبارسنجی مالی) را برطرف می‌کند.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۴۰۴

تحلیل و بررسی تخصصی

چگونه RecToM با بازسازی بازگشتی دیدگاه‌ها به دقت ۱۰۰٪ در Hi-ToM رسید؟

چارچوب استنتاجی جدید RecToM با استفاده از بازسازی بازگشتی دیدگاه‌ها، مدل‌های زبانی را قادر ساخت تا باورهای تودرتو را به‌طور دقیق مدل‌سازی کنند. این متد با بهره‌گیری از GPT-5.4 و Qwen3.5، برای نخستین بار به دقت ۱۰۰٪ در بنچمارک Hi-ToM دست یافت.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۵

تحلیل و بررسی تخصصی

Lung-R1: عبور از بازیابی اطلاعات به استدلال تشخیصی با گراف دانش

محققان مدل Lung-R1 را توسعه داده‌اند؛ یک مدل زبانی بزرگ ۱۴ میلیارد پارامتری که با ادغام یک گراف دانش گسترده، از بازیابی ساده‌ی حقایق به استدلال تشخیصی بیمار-محور حرکت می‌کند. این مدل در تشخیص داده‌های پرونده‌های الکترونیک سلامت، عملکردی پیشرو داشته و مدل‌های فاقد گراف دانش را شکست داد.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۶

تحلیل و بررسی تخصصی

چرا استدلال قوی‌تر مدل‌ها برای جست‌وجوی عمیق در وب کافی نیست؟

TreeSeeker چارچوب جدیدی است که با استفاده از حافظه ساختاردرختی و سیگنال‌های UCB، مانع از گیر کردن عامل‌های هوش مصنوعی در مسیرهای بن‌بست می‌شود. این رویکرد ثابت می‌کند که برای جست‌وجوی عمیق، مدیریت وضعیت معماری مؤثرتر از تکیه بر منطق داخلی مدل است.

۲۲ خرداد ۱۴۰۵۲ دقیقه خواندن

۱۴۰۷

تحلیل و بررسی تخصصی

MoCA-Agent: دستیابی به دقت ۸۵.۶٪ در تحلیل مالی با معماری بازار ادعا

سیستم MoCA-Agent با معرفی معماری «بازار ادعا»، استدلال عددی در تحلیل‌های مالی را متحول کرده و به دقت ۸۵.۶٪ در بنچمارک FinChart-Bench رسیده است. این مدل به‌جای بحث‌های متنی، بر تأیید ادعاهای اتمی و سنتز کد پایتون متمرکز است تا خطاهای محاسباتی را حذف کند.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۸

داریو آمودی، مدیرعامل انثروپیک، که تنها یک گزارش مستقیم دارد.

اخبار کوتاه روزانه

چرا مدیرعامل انتراپیک تنها یک زیرمجموعه مستقیم دارد؟

داریو آمودئی، مدیرعامل انتراپیک، تمامی عملیات روزمره شرکت را به خواهرش دانیلا سپرده است. در این ساختار غیرمتعارف، او تنها یک زیرمجموعه مستقیم دارد تا تمرکز خود را به‌طور کامل بر چشم‌انداز فنی و پژوهشی نگه دارد.

۲۲ خرداد ۱۴۰۵۱ دقیقه خواندن

۱۴۰۹

خروج اوپندور از هند، گفتگوی بزرگ‌تری درباره هوش مصنوعی و برون‌سپاری را برانگیخته

اخبار کوتاه روزانه

درون چرخش راهبردی Opendoor: جایگزینی نیروی ارزان هند با تیم‌های AI-Native

شرکت Opendoor با تعطیلی دفاتر خود در هند، مسیر خود را به سمت تیم‌های کوچک‌تر و «بومیِ هوش مصنوعی» تغییر می‌دهد. این اقدام نشان‌دهنده سقوط مدل سنتی برون‌سپاری است؛ چرا که هوش مصنوعی نیاز به نیروی انسانی گسترده برای کارهای اداری را از بین می‌برد.

۲۲ خرداد ۱۴۰۵۴ دقیقه خواندن

۱۴۱۰

رابط کاربری SaaS با بنر افشای قانون هوش مصنوعی اتحادیه اروپا و کد پیاده‌سازی

آموزش کاربردی

جریمه ۱۵ میلیون یورویی برای SaaSها: چهار الزام شفافیت اتحادیه اروپا تا ۲۰۲۶

ارائه‌دهندگان خدمات ابری (SaaS) که کاربر اروپایی دارند، باید تا ۲ اوت ۲۰۲۶ اعلان‌های شفافیت هوش مصنوعی را در رابط کاربری خود پیاده کنند. عدم افشای تعاملات با AI و محتواهای مصنوعی می‌تواند جریمه‌هایی تا ۱۵ میلیون یورو داشته باشد.

۲۲ خرداد ۱۴۰۵۴ دقیقه خواندن