台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

2023-06-20 00:07:34

台湾国立大学机器学习基石.听课笔记（第十六讲一）：

Three Learning Principle

一，Occam's Razor

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

相对简单的模型，也许对数据的训练和测试得出来的结果更好。

1，从数学理论说

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

根据数据的特点，我们做测试和训练时采的数据也要有特点。

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

所以：1，训练和测试的数据要独立同分布

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

2，根据数据的特点，选取训练数据

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

我们以货币交易为例子，前两年是做训练，后两年做测试。

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)

我们以前6年和后2年做训练，得出的结果很好，但是结果并不一定真实；然而以前6年做测试，后两年做训练，结果不会很好，但是结果会更加真实。那我们要如何解决数据窥视呢？

台湾国立大学机器学习基石.听课笔记（第十六讲一）：Three Learning Principle一，Occam's Razor二， Sampling Biase三，Data Snooping(数据窥测)