Výběr významných prediktorů z velkého množství časových řad

Výběr významných prediktorů z velkého množství časových řad

event_note 28.05.2021

Výpočty podhodnocených a nadhodnocených akcií aktuálně provádíme v rámci proof of concept řešení, které je postaveno na komerčním software s vnitřními omezeními.

Připravujeme proto nový robustní produkční systém, ve kterém dokážeme využít synergií s již existujícími komponentami z dalších oblastí, například pro postprocessing výsledků.

Těmito kroky byla úspěšně uzavřená část Feature selection.

 

* Nejnáročnější výpočetní fází při tvorbě modelu je příprava/preprocessing dat.

**Model mohl mít na trénovacích datech (tedy datech které při procesu učení viděl) skvělé výsledky, ale na testovacích (které při procesu učení neviděl), dosahovat špatných výsledků.

***Pod časovou řadou si lze představit vývoj hodnot ukazatelů v čase, například close cena či (nejenom z ní) odvozené ukazatele jako například Currency Volume. U těchto ukazatelů vždy zjišťujeme jejich významnost vůči cílové proměnné (například normalizovanému dennímu výnosu) za pomoci různých statistických testů (například test T-test).  Abychom zabránili přeučení, nevýznamné časové řady z výpočtu odstraňujeme.