算了,看到哪写到哪吧
其中第一个,关于差分的操作,一阶的差分不够用,要尽量使用分数阶的差分操作
Integer differentiation
这个是说,人们为了得到stationary的time series,会做一阶差分,发现不行,就二阶差分,总之就是整数阶差分。
比如金融里面的log return,就是log price做一阶差分,几十年来学术界都是这么干的。但作者说:
这么做是错误的!
为什么呢?
其实嘛,如果是价格序列本身,它显然不是平稳的,平稳就是说均值、方差是固定不变的,当然最严格的平稳要求概率分布一致,就先不说那些,只说一些朴素的概念。价格序列虽然不是平稳的,但它是有记忆的,就是说各个样本独立性很差,高度相关的,所以如果是预测价格本身R平方可以非常非常高。
为了得到平稳时间序列一般用一阶差分,这样得到的是价格的增量,一般认为是平稳的,但同时它也是比较独立的,也就是说没有记忆的,这么样做预测的话R平方非常非常低。一般来说人们用机器学习做金融都是预测对数收益率之类的东西。
但作者说一阶差分太极端,要用分数阶差分,或者说分形导数之类的东西。有兴趣可以参考
参考文献:
如何看待《The 7 Reasons Most Machine Learning Funds Fail》 ? https://zhuanlan.zhihu.com/p/29208399
额外收获:
panacea 万能药,灵丹妙药