تخصیص سهام در افقهای زمانی میانمدت تا بلندمدت همواره با چالشهای اساسی مواجه بوده است. ضعف سیگنالهای پیشبینی، تغییر مداوم رژیمهای بازار و افت عملکرد این سیگنالها در شرایط واقعی معاملات از مهمترین موانع پیشروی سرمایهگذاران هستند. روشهای سنتی معمولاً به پیشبینهای منفرد یا سیستمهای loosely connected وابستهاند که در برابر تغییرات شرایط بازار فاقد استحکام کافی هستند.
EvoNash-MARL این محدودیتها را با معماری یکپارچه closed-loop هدف قرار داده است. این چارچوب یادگیری تقویتی را با بهینهسازی مبتنی بر جمعیت و انتخاب آگاهانه از محدودیتها ترکیب میکند. سیستم از جمعیتهای چندعامله policy استفاده میکند، اصول game-theoretic را برای تلفیق استراتژیها به کار میگیرد و مکانیزمهای اعتبارسنجی را در طراحی آزمایشی walk-forward ادغام میسازد.
ارزیابی عملکرد این رویکرد با پروتکل walk-forward در ۱۲۰ پنجره زمانی انجام شده است. پیکربندی نهایی بالاترین امتیاز robustness را در مقایسههای داخلی کسب کرده است. آزمون بر روی دادههای out-of-sample از سال ۲۰۱۴ تا ۲۰۲۴ نشان میدهد که این روش بازدهی سالانه ۱۹.۶٪ را در مقابل ۱۱.۷٪ برای شاخص SPY به دست آورده است. ارزیابی گستردهتر تا سال ۲۰۲۶ پایداری مداوم در شرایط مختلف بازار را تأیید میکند.
با این حال، آزمونهای آماری با روشهای White's Reality Check و SPA-lite significance آماری قوی را اثبات نکردهاند. بنابراین، نتایج باید به عنوان شواهدی از بهبود robustness تفسیر شوند، نه به عنوان اثبات قاطع توانایی زمانبندی بازار. متدولوژی یکپارچه walk-forward امکان اعتبارسنجی نظامند را فراهم میسازد و ملاحظات عملی معاملات را در طول فرآیند توسعه حفظ میکند.

گفتگو