博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
过度拟合的问题
阅读量:5123 次
发布时间:2019-06-13

本文共 614 字,大约阅读时间需要 2 分钟。

考虑问题的预测Y从X∈R.下面左边的图显示拟合Y = θ0 +θ1X数据集的结果。我们看到数据并不是真的在直线上,所以拟合度不是很好。

相反,如果我们增加一个额外的元素x2,并且去拟合y=θ01x+θ2x2。然后我们得到一个稍微好一些的数据(参见下图)。天真的是,似乎我们添加的元素越多越好。

然而添加太多的元素也有危险:最右边的图是一个第五阶多项式拟合的结果。

我们看到,即使拟合曲线完美地通过数据,我们不应该期望这是一个很好的预测,例如,住房价格(Y)为不同的生活区(X)。没有正式定义这些术语的含义,我们会说,左边的图显示了一个实例中的数据清楚地表明欠拟合和右边的图是过拟合实例。

 

欠,或高的偏见,我们假设函数H图不到数据趋势的形成是当。它通常是由于函数过于简单或使用的功能太少而造成的。在另一个极端,过度拟合,或高的方差,以适合可用的数据但不概括以及对新的数据进行预测的假设函数引起的。它通常是由一个复杂的函数引起的,它会产生许多与数据无关的不必要的曲线和角度。

 

 

本术语适用于线性和逻辑回归。有解决过拟合问题两个主要选项:

1.减少特征的数量:

· 手动选择保留的特征值。

· 使用模型选择算法(在课程后期学习)。

2.正则化

· 保留所有特征值,但是减小θj。

· 正则化的作品时,我们有很多稍微有用的特征值。

转载于:https://www.cnblogs.com/zhengzhe/p/7225901.html

你可能感兴趣的文章
linux history
查看>>
除去内容中的空格与换行
查看>>
jQuery on(),live(),trigger()
查看>>
Python2.7 urlparse
查看>>
sencha touch在华为emotion ui 2.0自带浏览器中圆角溢出的bug
查看>>
【架构】Linux的架构(architecture)
查看>>
ASM 图解
查看>>
Filter过滤器
查看>>
任务管理器启动资源管理器
查看>>
canny算法的实现(android加载图片,数组写入文件换行)
查看>>
oracle数据库查看用户相关语句
查看>>
jps、jstack、jmap、jhat、jstat、hprof使用详解
查看>>
Docker 搭建java+tomcat
查看>>
Codeforces Round #410 (Div. 2)(A,字符串,水坑,B,暴力枚举,C,思维题,D,区间贪心)
查看>>
我的第一次Pascal程序
查看>>
设计模式——策略模式
查看>>
P2058 海港
查看>>
python内置函数
查看>>
matplotlib 中文显示 的问题
查看>>
函数进阶
查看>>