大数据分类利器---支持向量机(SVM)入门介绍
2015-10-25 MedSci MedSci原创
什么是分类分析? 让我们思考一个例子。假设某总体50%是男性,50% 是女性。你想要通过一个样本(集)获取一些规则,以确定总体其余部分成员的性别。使用支持向量机,相当于建立一个判断某人是男是女的机器。这是个典型的分类问题。我们试图通过一些规则,把总体分为两个可能的部分。出于简便考虑,这里假设两个用来区分的要素为:身高、头发长度。样本集的散点图如下: 图中的蓝色圆点代表女性,绿色方块代表男性
什么是分类分析? 让我们思考一个例子。假设某总体50%是男性,50% 是女性。你想要通过一个样本(集)获取一些规则,以确定总体其余部分成员的性别。使用支持向量机,相当于建立一个判断某人是男是女的机器。这是个典型的分类问题。我们试图通过一些规则,把总体分为两个可能的部分。出于简便考虑,这里假设两个用来区分的要素为:身高、头发长度。样本集的散点图如下: 图中的蓝色圆点代表女性,绿色方块代表男性。从图中可以推测: 1.总体中的男性平均身高更高 2.总体中的女性头发更长 如果某人身高180cm,头发4cm长,我们更可能将其判定为男性。这就是做分类分析的方式。 支持向量是什么?支持向量机(SVM)是什么? 支持向量就是单条记录的坐标。比如(45,150) 是对应一名女性的支持向量。支持向量机是能够区分男性和女性的最佳边界。在本例中,两个类别相隔清晰,所以更容易找到支持向量机。 如何确定当前案例的支持向量机? 当前的案例有很多可能的边界。下面是三种可能情况: 我们要如何确定哪条是最佳的边界? 要解释支持向量机目标函数(objective function)最简单的方法,是寻找与边界最近的支持向量(
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#支持向量机#
74
不明觉厉
135
好复杂,看不明白
157
可以看看
75
好复杂
194
朕
137