KNN中的K如何选取的【图文详解】

今天爱分享给大家带来KNN中的K如何选取的【图文详解】，希望能够帮助到大家。
关于什么是KNN，可以查看此文：《从K近邻算法、距离度量谈到KD树、SIFT+BBF算法》（链接：http://blog.csdn.net/v_july_v/article/details/8203674）。KNN中的K值选取对K近邻算法的结果会产生重大影响。如李航博士的一书「统计学习方法」上所说：

如果选择较小的K值，就相当于用较小的领域中的训练实例进行预测，“学习”近似误差会减小，只有与输入实例较近或相似的训练实例才会对预测结果起作用，与此同时带来的问题是“学习”的估计误差会增大，换句话说，K值的减小就意味着整体模型变得复杂，容易发生过拟合；
如果选择较大的K值，就相当于用较大领域中的训练实例进行预测，其优点是可以减少学习的估计误差，但缺点是学习的近似误差会增大。这时候，与输入实例较远（不相似的）训练实例也会对预测器作用，使预测发生错误，且K值的增大就意味着整体的模型变得简单。
K=N，则完全不足取，因为此时无论输入实例是什么，都只是简单的预测它属于在训练实例中最多的累，模型过于简单，忽略了训练实例中大量有用信息。
在实际应用中，K值一般取一个比较小的数值，例如采用交叉验证法（简单来说，就是一部分样本做训练集，一部分做测试集）来选择最优的K值。

原文链接：http://blog.itblood.com/4103.html，转载请注明出处。

KNN中的K如何选取的【图文详解】

在线客服

升级VIP

夜间模式

繁简切换

返回顶部

站点公告

🎉 本站五周年活动 🎉

KNN中的K如何选取的【图文详解】

相关推荐:

猜你喜欢

在线客服

升级VIP

夜间模式

繁简切换

返回顶部

站点公告

🎉 本站五周年活动 🎉