COVID-19 Data Analysis

Vettore COVID

Analisi tridimensionale dei dati COVID-19

Max Pierini


I dati giornalieri di

  • nuovi positivi
  • nuovi deceduti
  • occupazione terapie intensive

di COVID-19 in Italia (da Dipartimento di Protezione Civile) da cui è stato ricavato il trend per decomposizione stagionale per smussare le variazioni settimanali (vedi statsmodels per dettagli) sono stati utilizzati come coordinate in uno spazio tridimensionale

\begin{equation} \begin{bmatrix} x(t) \\ y(t) \\ z(t) \end{bmatrix} = \begin{bmatrix} \textrm{nuovi positivi} \\ \textrm{terapia intensiva} \\ \textrm{nuovi deceduti} \end{bmatrix} \end{equation}

e normalizzati

\begin{equation} \begin{bmatrix} X(t) \\ Y(t) \\ Z(t) \end{bmatrix} = \begin{bmatrix} x(t) \cdot \max(x)^{-1} \\ y(t) \cdot \max(y)^{-1} \\ z(t) \cdot \max(z)^{-1} \end{bmatrix} \end{equation}

anche in forma logaritmica

\begin{equation} \begin{bmatrix} \log{X}(t) \\ \log{Y}(t) \\ \log{Z}(t) \end{bmatrix} = \begin{bmatrix} \log{x(t)} \cdot \max(\log{x})^{-1} \\ \log{y(t)} \cdot \max(\log{y})^{-1} \\ \log{z(t)} \cdot \max(\log{z})^{-1} \end{bmatrix} \end{equation}

Dai dati dell'ultimo giorno $t=\tau$, è calcolato il modulo del vettori $\mathbf{v}_{raw}$ dei dati grezzi normalizzati e $\mathbf{v}_{\log}$ dei dati logaritmici normalizzati

\begin{equation} |\mathbf{v}_{raw}| = \sqrt{X(\tau)^2 + Y(\tau)^2 + Z(\tau)^2} \end{equation}

e

\begin{equation} |\mathbf{v}_{\log}| = \sqrt{\log X(\tau)^2 + \log Y(\tau)^2 + \log Z(\tau)^2} \end{equation}

In entrambi i casi, il modulo massimo $\max(|\mathbf{v}|)$ che il vettore può assumere è

\begin{equation} \max(|\mathbf{v}|) = \sqrt{1^2 + 1^2 + 1^2} = \sqrt{3} \end{equation}

e il volume massimo del cuboide con vertice [1,1,1]' è

\begin{equation} \max(\mathbf{V}) = 1 \cdot 1 \cdot 1 = 1 \end{equation}

da cui vengono calcolate le percentuali $p(\mathbf{v}_{raw})$ e $p(\mathbf{v}_{\log})$

\begin{equation} p(\mathbf{v}_{raw}) = \frac{|\mathbf{v}_{raw}|}{\max(|\mathbf{v}|)} = \frac{|\mathbf{v}_{raw}|}{\sqrt{3}} \end{equation}\begin{equation} p(\mathbf{v}_{\log}) = \frac{|\mathbf{v}_{\log}|}{\max(|\mathbf{v}|)} = \frac{|\mathbf{v}_{\log}|}{\sqrt{3}} \end{equation}

e i volumi

\begin{equation} \mathbf{V}_{raw} = X(\tau) \cdot Y(\tau) \cdot Z(\tau) \end{equation}\begin{equation} \mathbf{V}_{\log} = \log X(\tau) \cdot \log Y(\tau) \cdot \log Z(\tau) \end{equation}

che saranno pari a 1 (100%) se il valore attuale è il massimo osservabile e pari a 0 in caso di completa risoluzione dell'evento pandemico.

Valori intermedi, saranno una stima della situazione attuale. In particolare

  • $p(\mathbf{v}_{raw})$ e $\mathbf{V}_{raw}$ sono una buona indicazione della condizione attuale rispetto al massimo osservabile
  • $p(\mathbf{v}_{\log})$ e $\mathbf{V}_{\log}$ sono una buona indicazione della condizione attuale rispetto alla completa risoluzione

I moduli sono maggiormente sensibili alle singole coordinate. È sufficiente infatti che una sola coordinata sia al massimo (ovvero 1, essendo normalizzate) per avere un modulo del 57.7% ($1 / \sqrt{3}$) e che due siano al massimo per avere un modulo del 81.6% ($\sqrt{2} / \sqrt{3}$).

l volumi sono al contrario maggiormente sensibili all'insieme delle coordinate. Se anche due coordinate sono al massimo ma una soltanto è a al minimo (pari a 0), il volume sarà nullo.

Nella rappresentazione tridimensionale sui piani $XY$, $YZ$ e $XZ$ sono visibili le correlazioni bidimensionali dei dati normalizzati, suddivise per semestri.

NOTA: la decomposizione stagionale, con periodo 7 giorni, comporta che mediamente 3.5 giorni siano nulli agli estremi della serie temporale. Pertanto il dato più aggiornato risale a 3 giorni fa

Situazione attuale

Serie temporali

Le linee tratteggiate indicano la situazione 1 anno prima

Massimi

Minimi