台湾国立大学机器学习基石.听课笔记(第十六讲一):
Three Learning Principle
一,Occam's Razor
相对简单的模型,也许对数据的训练和测试得出来的结果更好。
1,从数学理论说
2,从逻辑上来说
二, Sampling Biase
根据数据的特点,我们做测试和训练时采的数据也要有特点。
所以:1,训练和测试的数据要独立同分布
2,根据数据的特点,选取训练数据
三,Data Snooping(数据窥测)
我们以货币交易为例子,前两年是做训练,后两年做测试。
我们以前6年和后2年做训练,得出的结果很好,但是结果并不一定真实;然而以前6年做测试,后两年做训练,结果不会很好,但是结果会更加真实。 那我们要如何解决数据窥视呢?