拓端tecdat|R语言指数加权模型EWMA预测股市多变量波动率时间序列

从广义上讲，复杂的模型可以实现很高的预测准确性。

但是您的读者需要快速理解。他们没有意愿或时间去处理任何太乏味的事情，即使它可以稍微准确一些。简单性是商业中非常重要的模型选择标准。在多元波动率估计中，最简单的方法是使用历史协方差矩阵。但这太简单了，我们已经知道波动性是随时间变化的。您经常看到从业者使用滚动标准差来模拟随时间变化的波动率。它可能不如其他最先进的方法准确，但它实现起来非常简单，也很容易解释。

什么是滚动窗口估计。如果我们有一个包含 5 个观察值的向量并且我们使用 2 个窗口，那么用于估计的权重向量是 [0,0,0,0.5,0.5]。更进一步的做法是对更远的过去给予少一些权重，但要对最近的观察样本给予更大的权重，比如权重向量 [0.05, 0.1, 0.15, 0.3, 0.4]。

根据低波动率跟着低波动率走，高波动率跟着高波动率走（波动率聚类）的典型事实，这个想法完全适合于多变量波动率预测。请考虑以下情况。

(1)

其中

拓端tecdat|R语言指数加权模型EWMA预测股市多变量波动率时间序列

是协方差矩阵的当前估计，并且

拓端tecdat|R语言指数加权模型EWMA预测股市多变量波动率时间序列

是基于过去直到时间段 t-1 的协方差矩阵。我们使用最简单的估计，即历史协方差矩阵，但增加了一些权重（

拓端tecdat|R语言指数加权模型EWMA预测股市多变量波动率时间序列

）到仅基于最近的观察估计的协方差矩阵。这真的很容易解释，几乎是一个行业标准。可以估计我们希望权重下降的速度，但您也可以根据一些先前的研究，将衰减参数估计为 0.94。

我绘制几个不同 lambda 值随时间变化的相关矩阵：

1.   
2.  k <- 10 # 几年前？
3.   
4.  end<- format(Sys.Date(),"%Y-%m-%d")
5.   
6.  start<-format(Sys.Date() - (k*365),"%Y-%m-%d")
7.   
8.   
9.   
10.  dat0 = getSymbols
11.   
12.  for (i in 1:l){
13.   
14.  da0 = getSymbols(sym[i])
15.   
16.  ret[2:n,i] 
17.  }
18.   
19.  EWMAplot
20.  legend

您可以看到，如果您为最后一次观察样本分配 15% 的权重，您会得到一些不稳定的估计。仅 5% (lambda = 0.95) 的权重给出了更平滑的估计，但可能不太准确。

除了简单之外，另一个重要的优点是不需要关心可逆性，因为在每个时间点上，估计值只是两个有效的相关矩阵的加权平均数。还有，你可以将这种方法应用于任何金融工具，不管是流动的还是非流动的，这是它受欢迎的另一个原因。

1.   
2.  EWMA <-
3.   
4.  function {
5.   
6.  ## ＃＃＃输入。
7.   
8.  ## factors N x K的数字因素数据。数据是类data.frame
9.   
10.  ## N是时间长度，K是因素的数量。  
11.   
12.  ## lambda 标量。指数衰减系数在0和1之间。
13.   
14.  ## return.cor 如果是TRUE则返回EWMA相关矩阵
15.   
16.  ##输出。  
17.   
18.   
19.   
20.  covewma = array
21.  covf = var(factors)  # 时间=0时的无条件方差为EWMA
22.   
23.  mfas <- apply(factors,2, mean)
24.   
25.  for (i in 2:t.factor) {
26.  FF 
27.  cov.f.ewma
28.  }
29.   
30.  }
31.   
32.   
33.  if(return.cor) {
34.   
35.  cewma 
36.  for (i in 1:dim[1]) {
37.   
38.  corewma= covr(coewm[i, ,])
39.

这个函数不适合用于样本外的预测。原因是我们向样本协方差矩阵收缩，而协方差矩阵是基于全样本的，在样本结束前我们还不知道。在现实的设置中，我们只能使用到我们希望预测的那一点为止的信息。随后，我改变了原始函数，加入了一个额外的参数（用于估计协方差矩阵的初始窗口长度）。然后，初始协方差矩阵的取值只使用到预测时为止的信息，标准化也是如此。修改后的新函数如下

1.  EWMAs <- function{
2.   
3.   
4.  # 调整了样本外的协方差预测
5.   
6.  ## 输入。
7.   
8.  ##因素N x K数字因素数据。数据是类data.frame
9.   
10.  ## N是时间长度，K是因素的数量。  
11.   
12.  ## la指数衰减因子在0和1之间。
13.   
14.  ## retu 逻辑的，如果是TRUE则返回EWMA相关矩阵
15.   
16.  ##输出。  
17.   
18.   
19.   
20.  coa = array(,c(t.cor,k.tor,k.aor))
21.   
22.  fas <- apply
23.   
24.  covf = var
25.  co.ewa[(wind-1),,] = (1-lad)*FF  + ada*cov.f
26.   
27.  for (i in wind : t.factor) {
28.   
29.  covf = var# 到t的无条件方差。
30.   
31.   
32.  FF = (fators[i,]- mctors) %*% t(factors[i,]- mfcrs)
33.   
34.  coma[i,,] = (1-laa)*FF  + laba*coma[(i-1),,]
35.   
36.   
37.   
38.  for (i in wn:dim) {
39.   
40.  orma[i, , ] = covr(owma[i, ,])

拓端tecdat|R语言指数加权模型EWMA预测股市多变量波动率时间序列

继续阅读

生物信息学入门使用 GEO基因芯片数据进行差异表达分析（DEG）——Limma 算法数据代码结果解读

为什么选择R语言为什么选择R语言

Aspera/FTP下载SRA/fastq文件后根据样本信息进行批量重命名

bam格式转换为Fastq/Fasta格式bam格式转换为Fastq/Fasta格式

非参数统计分析

R语言实战 - 基本统计分析（1）- 描述性统计分析

跟着Cell学单细胞转录组分析(十二):转录因子分析

R语言|绘制三维图

数据的归一化（Normalization）、标准化（Standardization）

R语言| 中介效应分析，Mediation包和BruceR包，循环Process函数

【R语言】GARCH模型的应用一、数据来源二、数据分析三、模型建立四、模型优化五、结论六、实现代码七、参考资料

Python TensorFlow循环神经网络RNN-LSTM神经网络预测股票市场价格时间序列和MSE评估准确性

Matlab随机波动率SV、GARCH用MCMC马尔可夫链蒙特卡罗方法分析汇率时间序列

Lagrange插值的R语言实现

R语言-相关性分析函数

拓端tecdat|R语言弹性网络Elastic Net正则化惩罚回归模型交叉验证可视化