Seja o vetor aleatório \(\mathbf{X}=(X_1, X_2)\) com distribuição normal bivariada com vetor de médias \(\boldsymbol{\mu}\) e matriz de covariância \(\boldsymbol{\Sigma}_\mathbf{X}\). sua função de densidade de probabilidades é: \[\begin{align} f(x_1, x_2) = \frac{1}{2\pi \sigma_1 \sigma_2 \sqrt{1 - \rho^2}} \exp\left\{- \frac{1}{2(1-\rho^2)} \left[ \left( \frac{X_1 - \mu_1}{\sigma_1} \right)^2 - 2\rho \frac{(x_1 - \mu_1)(x_2 - \mu_2)}{\sigma_1 \sigma_2} + \left( \frac{X_2 - \mu_2}{\sigma_2} \right)^2 \right] \right\} \end{align}\]
ou seja, depende de cinco parâmetros.
As funções de densidade de probabilidade marginais de \(\mathbf{X}\) são normais, com: \[\begin{align} X_1 & \sim \mathcal{Normal})(\mu_1, \sigma_1^2) \\ X_2 & \sim \mathcal{Normal})(\mu_2, \sigma_2^2) \end{align}\]
As funções de densidade de probabilidade condicionais de de \(\mathbf{X}\) são normais, com: \[\begin{align} X_1|X_2=x_2 & \sim \mathcal{Normal} \left( \mu_1 + \rho \frac{\sigma_1}{\sigma_2}(x_2 - \mu_2), \sigma_1^2(1 - \rho^2) \right) \\ X_2|X_1=x_1 & \sim \mathcal{Normal} \left( \mu_2 + \rho \frac{\sigma_2}{\sigma_1}(x_1 - \mu_1), \sigma_2^2(1 - \rho^2) \right) \end{align}\]
A função de densidade conjunta de qualquer vetor aleatório bidimensional \(\mathbf{X} = (X_1, X_2)\) é: \[ f_{X_1X_2} (x_1, x_2) = f_{X_1|X_2}(x_1|x_2) f_{X_2}(x_2) = f_{X_2|X_1}(x_2|x_1) f_{X_1}(x_1) \]
A variável aleatória normal p-multivariada (da qual a normal bivariada é um caso particular) pode ser expressa como \(p\) combinações lineares de \(m\) variáveis aleatórias normais padrão independentes. Seja \(Z_1, Z_2, \dots, Z_m\) uma sequência de variáveis aleatórias independentes e indenticamente distribuídas, com \(Z_1 \sim \mathcal{Normal}(0,1)\). Sejam as constantes \(\alpha_{ij}\), \(i = 1, 2, \dots, n\) e \(j = 1, 2, \dots, m\) e \(\mu_i\), \(i = 1, 2, \dots, n\). Sejam as combinações lineares abaixo:
\[\begin{align} X_1 & = a_{11}Z_1 + a_{12}Z_2 \dots a_{1m} Z_m + \mu_1 \\ \vdots & \\ X_i & = a_{i1}Z_1 + a_{i2}Z_2 \dots a_{im} Z_m + \mu_i \\ \vdots & \\ X_n & = a_{n1}Z_1 + a_{n2}Z_2 \dots a_{nm} Z_m + \mu_n \end{align}\]
Essas combinações lineares podem ser expressas em matrizes: \[\begin{align} \begin{bmatrix} X_1 \\ X_2 \\ \vdots \\ X_n \end{bmatrix} = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1m} \\ a_{21} & a_{22} & \dots & a_{2m} \\ \vdots & \vdots & \vdots & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nm} \\ \end{bmatrix} \begin{bmatrix} Z_1 \\ Z_2 \\ \vdots \\ Z_m \end{bmatrix} + \begin{bmatrix} \mu_1 \\ \mu_2 \\ \vdots \\ \mu_n \end{bmatrix} \end{align}\]
ou seja, \[ \mathbf{X}_{n\times1} = \mathbf{A}_{n\times m} \mathbf{Z}_{m\times 1} + \boldsymbol{\mu}_{n\times 1} \] A esperança do vetor \(\mathbf{X}\) é o vetor \(\mathbf{\mu}\) e sua matriz de covariâncias é: \[ \operatorname{Var}(\mathbf{X}) = \operatorname{Var}(\mathbf{A}\mathbf{Z} + \boldsymbol{\mu}) = \mathbf{A}\operatorname{Var}(\mathbf{Z})\mathbf{A}^\prime = \mathbf{A}\mathbf{A}^\prime \] Ou seja, \(\mathbf{X} \sim \mathcal{Normal}_p(\boldsymbol{\mu},\boldsymbol{\Sigma}_\mathbf{X})\), já que as variáveis aleatórias \(X_i\) são normais, pois são combinações lineares de variáveis aleatórias normais independentes. As covariâncias de \(\boldsymbol{\Sigma_\mathbf{X}}\) são: \[\begin{align} \operatorname{Cov}(X_i, X_j) = \operatorname{Cov} \left( \sum_{k=1}^m a_{ik}Z_k , \sum_{r=1}^m a_{jr} Z_r \right) = \sum_{k=1}^m \sum_{r=1}^m a_{ik} a_{jr}\operatorname{Cov}(Z_k, Z_r) = \sum_{k=1}^m a_{ik} a_{jk} = \sigma_{ij} \end{align}\]
, pois, \[ \operatorname{Cov}(Z_k, Z_r) = \begin{cases} 1 &, k=r \\ 0 &, k \not= r\end{cases}. \]
Importante: Para os vetores aleatórias normais, \(\mathbf{X}\), a distribuição conjunta é completamente determinada pelas quantidades \(\operatorname{E}(X_i)\) e \(\operatorname{Cov}(X_i, X_j)\), \(i,j = 1, 2, \dots, n\), ou seja, é completamente determinado pelo vetor de médias \(\boldsymbol{\mu}=\mu_1, \mu_2, \dots, \mu_n)^\prime\) e matriz de covariâncias \(\boldsymbol{\Sigma}_\mathbf{X}\).
O objetivo é gerar um vetor aleatório normal p-variado, \(\mathbf{X} = (X_1, X_2, \dots, X_p)^\prime\), com vetor de médias \(\boldsymbol{\mu}\) e matriz de covariâncias \(\boldsymbol{\Sigma}_\mathbf{X}\).
Uma abordagem possível é:
Gerando o vetor aleatório normal bivariado
\[ \begin{bmatrix} X_1 \\ X_2 \end{bmatrix} \sim\mathcal{N}_2\left( \begin{bmatrix} \mu_1 \\ \mu_2 \end{bmatrix}, \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \end{bmatrix} \right) \] A matriz de decomposição de Choleski para a matriz \(\boldsymbol{\Sigma}\) é:
\[ \mathbf{A} = \begin{bmatrix} a_{11} & 0 \\ a_{21} & a_{22} \end{bmatrix}, \] e
\[\begin{align} \mathbf{A} \mathbf{A}^\prime = \begin{bmatrix} a_{11} & 0 \\ a_{21} & a_{22} \end{bmatrix} = \begin{bmatrix} a_{11} & a_{21} \\ 0 & a_{22} \end{bmatrix} = \begin{bmatrix} a_{11}^2 & a_{11}a_{21} \\ a_{11}a_{21} & a_{11}^2 + a_{22}^2 \end{bmatrix} = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \end{bmatrix}, \end{align}\]
tem-se assim que:
\[\begin{align} a_{11} & = \sigma_1 \\ a_{21} & = \rho \sigma_2 \\ a_{22} & = \sigma_2 \sqrt{1 - \rho^2} \end{align}\]
Fazendo \[ \mathbf{A} = \begin{bmatrix} \sigma_1 & 0 \\ \rho \sigma_2 & \sigma_2 \sqrt{1 - \rho^2} \end{bmatrix}, \]
Para gerar \((X_1, X_2)\), valores aleatórios de uma normal bivariada:
Gerar \(Z_1\) e \(Z_2\) números aleatórios normais padrão independentes.
Faz-se \(\mathbf{X} = \mathbf{A} \mathbf{Z} + \boldsymbol{\mu}\), com
\[\begin{align} X_1 & = \sigma_1 Z_1 + \mu_1 \\ X_2 & = \rho \sigma_2 Z_1 + \sigma_2 \sqrt{1-\rho^2} Z_2 + \mu_2. \end{align}\]