pca算法实例,pca算法的定义
线性分类:
如果所有要分类的数据都是线性可分的,那么直线f(x )=ax b是可以分的。这种方法叫做线性分类器,线性分类器的学习目标是在N维数据空间中寻找超平面。也就是说,数据并不总是二维的。比如三维超平面就是一个平面。其实无数超平面都可以分割数据,但是一定要选择最好的分割。
它有
最大间隔分类器
,简称MMH,分类一个数据点。超平面和数据点之间的“间隔”越大,分类的置信度就越大。因此,为了尽可能提高分类的置信度,需要使选择的超平面最大化这个“区间”的值。
核函数:当是非线性分类即线性不可分的时候,需要转换高纬度,核函数就是先在低维上进行计算,将实质上的分类效果反映在高维上,避免了直接在高维上进行的复杂计算。
几种常用核函数:
h次多项式核)。
冷月光径向基函数核)))))))。
s形核函数(Sigmoid函数核))。
图像分类通常使用冷月的径向基函数。由于分类平滑,文本不适合冷月径向基函数。没有标准答案。请尝试各种核函数,以准确率来判断。
Python代码实现:
1.模块部署
2.使用正态分布获得数字
3.得到超平面d(z )=wx b,w,斜率a。
4.画一条线,以便找到与该点相切的线