پیشرفت در حوزه یادگیری ماشین همواره بر نوآوری در معماری مدلها متمرکز بوده است، اما عملکرد قابل دستیابی اغلب به پیچیدگی ذاتی دادهها محدود میشود. پژوهش حاضر تأثیر تراکم نمونهها، اندازهگیریشده از طریق تعداد چهرهها، را بهعنوان محرک اصلی پیچیدگی دادهها تفکیک و کمّیسازی میکند. این تحقیق صرفاً به مشاهده سختی صحنههای شلوغ بسنده نکرده، بلکه با کنترل دقیق عدم تعادل کلاسها، تخریب مشخص ناشی از تراکم را اندازهگیری کرده است.
آزمایشهای کنترلشده روی مجموعه دادههای WIDER FACE و Open Images، با محدودیت دقیق ۱ تا ۱۸ چهره در هر تصویر و نمونهبرداری کاملاً متعادل، نشان داد که عملکرد مدل با افزایش تعداد چهرهها بهطور یکنواخت افت میکند. این روند در پارادایمهای مختلف از جمله دستهبندی، رگرسیون و تشخیص صادق است، حتی زمانی که مدلها بهطور کامل در معرض کل محدوده تراکم قرار گرفتهاند.
علاوه بر این، مدلهایی که روی دادههای کمتراکم آموزش دیدهاند، قادر به تعمیم به تراکمهای بالاتر نیستند و سوگیری سیستماتیک در شمارش کمتر از واقع نشان میدهند. نرخ خطا تا ۴.۶ برابر افزایش مییابد که نشاندهنده تأثیر تراکم بهعنوان یک جابهجایی حوزهای است.
این یافتهها تراکم نمونهها را بهعنوان بُعدی ذاتی و قابل اندازهگیری از سختی دادهها تثبیت میکند و راه را برای مداخلات مشخص در یادگیری تدریجی و ارزیابی طبقهبندیشده بر اساس تراکم هموار میسازد. این پژوهش چارچوبی برای درک نحوه تأثیر تعداد اشیاء بر عملکرد مدلهای یادگیری ماشین ارائه میدهد و بینشهای تازهای درباره رابطه میان ویژگیهای داده و قابلیت الگوریتمی به دست میدهد.

گفتگو