贝叶斯分类算法原理,举例说明朴素贝叶斯分类算法的应用

　　[分类算法] :朴素贝叶斯1 .原理和理论基础（参考)2.火花代码示例)1) windows独立进口港.阿帕奇。火花。ml lib。分类。朴素贝叶斯。阿帕奇。火花。ml lib。回归。yydfimportorg。阿帕奇。火花。{ spark conf，spark context } object local _ naive Bayes { system。设置属性( Hadoop。导演。家)， e : /庄Ji/win util/ valsc=newsparkcontext(conf)/initiateddataandlabeleddavaldata=sc。textfile(e:/Java _ ws/Scala demo/data valparseddata=data。map { line=val parts=line。拆分(，)yydfy)部分(0).toDouble，vectors.dense(parts(1)).拆分()。地图(。to double))}//splitdatavalsplits=解析的数据。随机分割种子=1110 modelandcalculatedprecisionaccuracyvalmodel=朴素贝叶斯。)朴素贝叶斯模型类型=多点)valpredictionandlabel=test。映射(p=(模型。predict(p . features))，p . label()val精度=1.0 *预测和标注。滤波器(x=x _ 1==x _ 2).count )/test.count )/

spark-submit --class myNaiveBayes --master yarn ScalaDemo.jar

　　进口港.阿帕奇。火花。ml lib。分类.{ naivebayesmodel，朴素贝叶斯}导入工具.Apache.spark.ml lib .Lina LG。向量导入器。阿帕奇。火花。ml lib。回归。yydimporg spark context string]){ val conf=new spark conf).set appname(naive bame))naive valsc=newsparkcontext(conf)/initiated data and land name service 1/user/hit file sample _ naive _ Bayes _ data。 txt (valparseddata=data。map(line=val parts=line .)vectors.dense(parts(1).拆分()。地图(。to double))}//splitdatavalsplits=解析的数据。随机分割种子=1110 modelandcalculatedprecisionaccuracyvalmodel=朴素贝叶斯。)朴素贝叶斯模型类型=多点)valpredictionandlabel=test。映射(p=(模型。predict(p . features))，p . label()val精度=1.0 *预测和标注。滤波器(x=x _ 1==x _ 2).计数)/测试。count)/ valsamemodel=朴素贝叶斯模型。加载( HDFS://名称服务1/用户/配置单元/火花/朴素贝叶斯/模型3) py sparare

spark-submit pyNaiveBayes.py

　　# -编码：utf-8-frompyspark。ml lib。classificationimportnaivebayes，naivebayesmodelfrompyspark。ml lib。linalgimportvectorsfrompyspark。ml lib。regressionimportdfyportsparkcontent e= python pi )defparseline)line):parts=line。split)、label=float(parts[0])features=vectors .returnyydfy f特性(data=sc。textfile(HDFS://名称服务1/用户/hive/spark/data/sample _ naive _ Bayes seed=0)模型=naive Bayes。train(training，1.0)predictionandlabel=test p . label()accuracy=1.0 * predictionanand v):x==v).计数)/测试。count))count HDFS://名称服务1/用户/hive/spark/python naive Bayes/ HDFS://名称服务1/用户/hive/spark/python naive Bayes/model } 3 .python from sklear nimportnaive _ Bayes ii种子):test=[]train=[]random。种子)用于数据3360 ifrandom中的行。random m)==k:测试。追加(.加入(线))否则：火车。追加测试编号按分隔符表示分隔符2):x=[]y=[]for line in data:parts=line。split(分隔符1)x1=[float(a)for or y1x。append)x1)y . append)y1)返回x，y##读取数据data=open(e 3360/Java r )training，test=split data () ) testX， ##建模模型=朴素贝叶斯。简单的纤细(model.fit ) trainingY，trainingY ) #评估forbintestx 3360 print)型号。预测b)发布于2016-11-2211:52 HP dmb (…)注释…)编辑集合为：6

贝叶斯分类算法原理,举例说明朴素贝叶斯分类算法的应用