文章目录
- 前言
- 一、监督学习
- 定义
- 举个例子:
- 二、无监督学习
前言
最近学习了ng教授的机器学习课程,在这里进行一个回顾与总结,也希望我的文章可帮到一些正在学习机器学习的小伙伴。
在这里,主要理解一下监督学习和无监督学习。
一、监督学习
监督学习就是一种统计方法,是在有标签的数据里发现潜在的规律的一种训练方式。
定义
监督学习就是一种统计方法,是在有标签的数据里发现潜在的规律的一种训练方式。
举个例子:
假如我们知道了浙江省一些是否结婚的数据。把这些数据用坐标轴画下来,横轴表示年龄,纵轴表示是否结婚,结婚了表示1,单身表示0,这时你有一个朋友19岁,你想通过这些数据算出一个方程来估计你这位朋友是否结婚。这就是一个最简单的监督学习的算法。
当然在实际应用中我们不可能只有年龄这一个特征值,我们可能会有成百上千个特征值,这是就需要我们的进一步学习机器学习才能解决
二、无监督学习
理解了 监督学习,我们再学习无监督学习就简单了。
上个目录中,已经介绍了监督学习。回想当时的数据集,数据集中每条数据都已经标明是已婚还是未婚。所以,对于监督学习里的每条数据,我们已经清楚地知道,训练集对应的正确答案,是已婚还是未婚了。在无监督学习中,我们已知的数据。看上去有点不一样,不同于监督学习的数据的样子,即无监督学习中没有任何的标签。
同样的,我还是举一个例子来帮助大家理解:同样的一组数据,但是不告诉你婚姻情况,而是让计算机根据两组数据的特征自己进行判断,这时我们通过计算机将数据分成两类,就是已婚或未婚(但你自己并不知道),这时你的朋友再来,计算机就可以判断出他的婚恋情况。
这个例子就是非监督学习的过程,也就是说,在学习的过程中,只提供事物的具体特征(年龄),但不提供事物的标签(已婚或未婚),让计算机自己总结归纳。