تیمی از پژوهشگران جزئیات MeloTune را منتشر کردهاند؛ سامانهای که روی آیفون اجرا میشود و احساسات شنونده را در لحظه پیشبینی و مدیریت میکند. این معماری از پروتکل حافظه مش (MMP) و ادغام توجه برداری-نمادین (SVAF) به عنوان چارچوب تولیدی برای انتخاب موسیقی آگاه از عواطف بهره میبرد.
دو شبکه زمان پیوسته بستهای (CfC) به طور همزمان روی هر دستگاه فعال هستند. نخستین شبکه، مدل اختصاصی شنونده است که مسیرهای عاطفی کوتاهمدت را بر اساس مدل دایرهای راسل پیشبینی میکند. دومین شبکه در لایه ششم حافظه مش کار میکند و بلوکهای حافظه شناختی از همتایان همشنوا را ادغام میکند. حالتهای پنهان هرگز دستگاه را ترک نمیکنند؛ تنها بلوکهای ساختاریافته به اشتراک گذاشته میشوند.
تابع برانگیختگی شخصی جایگزین نگاشت خطی استاندارد شده است. این تابع تنظیمات فردی هر شنونده را بر اساس رفتارهایی مانند نرخ رد کردن آهنگ، تکمیل قطعه، علاقهمندیها و تغییرات صدا یاد میگیرد. نتیجه این است که یک قطعه برای شنوندگان مختلف پیشبینیهای متفاوتی ایجاد میکند.
{{img:0}}
مدل با تنها ۹۴,۵۵۲ پارامتر به خطای مطلق مسیر ۰.۴۱۴، دقت الگوی ۹۶.۶ درصد و دقت هدف ۶۹.۴ درصد دست یافته است. آزمایش عملیاتی روی ۴۶ مشاهده در ۱۱ سبک نشان داد حلقه یادگیری به درستی کار میکند. موسیقی پاپ پس از تنها ۲۲ مشاهده به اطمینان کامل رسید. تمام استنتاجها روی دستگاه از طریق CoreML انجام میشوند.
تیم توسعهدهنده کیت توسعه نرمافزاری (sym-swift v0.3.78) را منتشر کرده است. هدف اصلی این پژوهش نه موسیقی، بلکه زیربنای فنی MMP و SVAF است که قابلیت تطبیق با حوزههای دیگر را دارد.

گفتگو