Negli ultimi mesi abbiamo esaminato vari strumenti per aiutarci a identificare i modelli sfruttabili nei prezzi degli asset. In particolare abbiamo considerato l’econometria di base, il machine learning statistico e la statistica bayesiana.
Sebbene questi siano tutti ottimi strumenti moderni per l’analisi dei dati, la stragrande maggioranza dei modelli di asset nel settore utilizza ancora l’analisi statistica delle serie temporali. In questo articolo introduciamo l’analisi delle serie temporali, ne delimitiamo l’ambito e vediamo come applicare le tecniche a varie frequenze di dati finanziari.
Che cos'è l'analisi delle serie temporali?
In primo luogo, una serie temporale è definita come una quantità misurata sequenzialmente nel tempo per un certo intervallo.
Nella sua forma più ampia, l’analisi delle serie temporali consiste nel dedurre cosa è successo nel passato ad una serie di punti di dati, nel tentativo di prevedere cosa accadrà in futuro.
Tuttavia, adotteremo un approccio statistico quantitativo alle serie temporali, assumendo che le nostre serie temporali siano realizzazioni di sequenze di variabili casuali. Cioè, supponiamo che esista un sottostante processo di generazione per le serie temporali basato su una o più distribuzioni statistiche da cui sono tratte queste variabili.
L’analisi delle serie temporali tenta di comprendere il passato e prevedere il futuro.
Questa sequenza di variabili casuali è nota come processo stocastico a tempo discreto (DTSP). Nel trading quantitativo ci preoccupiamo di adattare i modelli statistici a questi DTSP per dedurre le relazioni sottostanti tra le serie o prevedere valori futuri al fine di generare segnali di trading.
Le serie temporali in generale, comprese quelle al di fuori del mondo finanziario, spesso contengono le seguenti caratteristiche:
- Tendenze: una tendenza è un movimento direzionale coerente in una serie temporale. Queste tendenze saranno deterministiche o stocastiche. Il primo ci consente di fornire una motivazione di fondo per il trend, mentre il secondo è una caratteristica casuale di una serie che difficilmente spiegheremo. Le tendenze appaiono spesso nelle serie finanziarie, in particolare nei prezzi delle materie prime, e molti fondi CTA (Commodity Trading Advisor) utilizzano sofisticati modelli di identificazione delle tendenze nei loro algoritmi di trading.
- Variazione stagionale: molte serie temporali contengono variazioni stagionali. Ciò è particolarmente vero nelle serie che rappresentano le vendite aziendali o i livelli climatici. Nella finanza quantitativa vediamo spesso variazioni stagionali delle materie prime, in particolare quelle relative alle stagioni di crescita o alla variazione annuale della temperatura (come il gas naturale).
- Dipendenza seriale – Una delle caratteristiche più importanti delle serie temporali, in particolare delle serie finanziarie, è quella della correlazione seriale. Ciò si verifica quando le osservazioni di serie temporali che sono vicine nel tempo tendono ad essere correlate. Il clustering della volatilità è un aspetto della correlazione seriale particolarmente importante nel trading quantitativo.
Come possiamo applicare l'analisi delle serie temporali nella finanza quantitativa?
Il nostro obiettivo come ricercatori quantitativi è identificare tendenze, variazioni stagionali e correlazioni applicando metodi statistici sulle serie temporali e, infine, generare segnali di trading o filtri basati su inferenze o previsioni.
Il nostro approccio sarà:
- Previsione e predizione dei valori futuri – Per operare con successo, avremo bisogno di prevedere con precisione i prezzi futuri degli asset, almeno in senso statistico.
- Simulare le serie – Una volta identificate le proprietà statistiche delle serie temporali finanziarie, possiamo utilizzarle per generare simulazioni di futuri scenari. Questo ci consente di stimare il numero di trade, i costi di transizione attesi, il profilo di rendimento atteso, l’investimento tecnico e finanziario richiesto in infrastrutture e quindi, in definitiva, il profilo di rischio e la redditività di una particolare strategia o portafoglio.
- Dedurre le relazioni – L’identificazione delle relazioni tra serie temporali e altri valori quantitativi ci consente di migliorare i nostri segnali di trading attraverso meccanismi di filtraggio. Ad esempio, se possiamo dedurre come lo spread in una coppia di valute estere varia con il volume bid / ask, allora possiamo filtrare qualsiasi potenziale trade che potrebbe verificarsi in un periodo dove si prevede uno spread elevato, in modo da ridurre i costi di transazione.
Inoltre, possiamo applicare i test statistici standard (classici / empirici o bayesiani) ai modelli di serie temporali al fine di giustificare determinati comportamenti, come il cambio di regime nei mercati azionari.
Roadmap dell'Analisi delle Serie Temporali su DataTrading
Fino ad oggi, gli articoli precedenti relativi all’apprendimento statistico, all’econometria e all’analisi bayesiana sono stati per lo più di natura introduttiva e non hanno considerato le applicazioni di tali tecniche alle moderne informazioni ad alta frequenza sui prezzi degli strumenti finanziari.
Per applicare alcune di queste tecniche ai dati ad alta frequenza abbiamo bisogno di un framework matematico in cui unificare la nostra ricerca. L’analisi delle serie temporali fornisce tale unificazione e ci consente di discutere diversi modelli indipendenti all’interno di un contesto statistico.
A tal fine utilizzeremo strumenti bayesiani e tecniche di machine learning in combinazione con i seguenti metodi per prevedere il livello e la direzione dei prezzi, agire come filtri e determinare il “cambio di regime”, ovvero determinare quando le nostre serie temporali hanno cambiato il loro comportamento statistico sottostante.
La nostra tabella di marcia per lo studi delle serie temporali è la seguente. Ciascuno dei seguenti argomenti sarà oggetto di uno articolo o di una serie di articoli. Dopo aver esaminato a fondo questi metodi, saremo in grado di creare alcuni moderni e sofisticati modelli per esaminare i dati ad alta frequenza.
- Introduzione alle serie temporali : questo articolo delinea l’area dell’analisi delle serie temporali, il suo ambito e come può essere applicato ai dati finanziari.
- Correlazione – Un aspetto assolutamente fondamentale della modellazione delle serie temporali è il concetto di correlazione seriale . Lo definiremo e descriveremo una delle più grandi insidie dell’analisi delle serie temporali, ovvero che “la correlazione non implica causalità” .
- Previsione – In questa sezione considereremo il concetto di previsione , ovvero fare previsioni relativamente alla direzione o al futuro livello per una particolare serie temporale e come viene eseguita nella pratica.
- Modelli stocastici – Si prenderà in esame alcuni modelli stocastici che ampliano il concetto di Moto Browniano Geometrico e Volatilità Stocastica, inclusi il rumore bianco e i modelli autoregressivi .
- Regressione – Quando abbiamo trend deterministici (opposti a quelli stocastici) nei dati, possiamo giustificare la loro estrapolazione utilizzando modelli di regressione. Considereremo sia la regressione lineare che non lineare e terremo conto della correlazione seriale.
- Modelli stazionari – I modelli stazionari presumono che le proprietà statistiche di una serie (vale a dire la media e la varianza) siano costanti nel tempo. Possiamo utilizzare modelli Moving Average (MA), nonché combinarli con modelli autoregressivi per formare modelli ARMA.
- Modelli non stazionari : molte serie temporali finanziarie non sono stazionarie, ovvero hanno media e varianza variabili. In particolare, i prezzi degli asset hanno spesso periodi di elevata volatilità. Per queste serie abbiamo bisogno di usare modelli non stazionari come ARIMA, ARCH e GARCH.
- Modellazione multivariata – In passato abbiamo già descritto modelli multivariati su DataTrading, in particolare quando abbiamo considerato il mean-reverting per le coppie di azioni. In questa sezione definiremo più rigorosamente la cointegrazione e esamineremo ulteriori test per essa. Considereremo anche modelli vettoriali autoregressivi (VAR) [da non confondere con Value-at-Risk!].
- Rappresentazione in spazio di Stato Modeling – E’ presa in prestito della moderna teoria del controllo utilizzata in ingegneria e ci permette di modellare le serie temporali con parametri che variano rapidamente (come la variabile di pendenza \(\beta\) tra due risorse cointegrate in una regressione lineare). In particolare, prenderemo in considerazione il famoso filtro di Kalman e il modello Markov nascosto . Questo sarà uno degli usi principali dell’analisi bayesiana nelle serie temporali.
Come queste Analisi sono collegati con altri articoli statistici su DataTrading?
L’obiettivo di DataTrading è sempre stato quello di provare a delineare il quadro matematico e statistico per l’analisi quantitativa e il trading quantitativo, dalle basi fino alle tecniche più avanzate.
Ad oggi abbiamo dedicato la maggior parte del tempo a tecniche introduttive e intermedie. Tuttavia, ora concentreremo la nostra attenzione sulle recenti tecniche avanzate, utilizzate dai hedge funds quantitativi.
Questo non solo aiuterà coloro che desiderano ottenere una carriera nel settore, ma fornirà anche ai trader retail tra di voi un kit di strumenti e metodi molto più ampio, nonché un approccio unificato al trading.
Si può affermare con certezza che la gran parte dei professionisti che lavorano nei fondi quantitativi utilizza tecniche molto sofisticate per “catturare l’alfa”.
Tuttavia, molte di queste aziende sono così grandi da non essere interessate a strategie con “capacità limitate”, ovvero quelle che non sono scalabili oltre 1-2 milioni di dollari. In qualità di retail, se possiamo applicare un sofisticato trading framework a queste aree, possiamo raggiungere una redditività a lungo termine.
Alla fine combineremo i nostri articoli sull’analisi delle serie temporali con l’approccio bayesiano alla verifica delle ipotesi e alla selezione del modello, insieme al codice Python, per produrre modelli di serie temporali non lineari e non stazionari che possono essere negoziate ad alta frequenza.
Inoltre, con il nostro software DTForex per il backtest ad alta frequenza di più coppie di valute, disponiamo di un framework già pronto per testare questi modelli, almeno sui mercati valutari.
Il prossimo articolo della serie discuterà la correlazione e il motivo per cui è uno degli aspetti più fondamentali dell’analisi delle serie temporali.