贝叶斯分类算法原理,举例说明朴素贝叶斯分类算法的应用

  贝叶斯分类算法原理,举例说明朴素贝叶斯分类算法的应用

  [分类算法] :朴素贝叶斯1 .原理和理论基础(参考)2.火花代码示例)1) windows独立进口港.阿帕奇。火花。ml lib。分类。朴素贝叶斯。阿帕奇。火花。ml lib。回归。yydfimportorg。阿帕奇。火花。{ spark conf,spark context } object local _ naive Bayes { system。设置属性( Hadoop。导演。家), e : /庄Ji/win util/ valsc=newsparkcontext(conf)/initiateddataandlabeleddavaldata=sc。textfile(e:/Java _ ws/Scala demo/data valparseddata=data。map { line=val parts=line。拆分(,)yydfy)部分(0).toDouble,vectors.dense(parts(1)).拆分()。地图(。to double))}//splitdatavalsplits=解析的数据。随机分割种子=1110 modelandcalculatedprecisionaccuracyvalmodel=朴素贝叶斯。)朴素贝叶斯模型类型=多点)valpredictionandlabel=test。映射(p=(模型。predict(p . features)),p . label()val精度=1.0 *预测和标注。滤波器(x=x _ 1==x _ 2).count )/test.count )/

  

spark-submit --class myNaiveBayes --master yarn ScalaDemo.jar

  进口港.阿帕奇。火花。ml lib。分类.{ naivebayesmodel,朴素贝叶斯}导入工具.Apache.spark.ml lib .Lina LG。向量导入器。阿帕奇。火花。ml lib。回归。yydimporg spark context string]){ val conf=new spark conf).set appname(naive bame))naive valsc=newsparkcontext(conf)/initiated data and land name service 1/user/hit file sample _ naive _ Bayes _ data。 txt (valparseddata=data。map(line=val parts=line .)vectors.dense(parts(1).拆分()。地图(。to double))}//splitdatavalsplits=解析的数据。随机分割种子=1110 modelandcalculatedprecisionaccuracyvalmodel=朴素贝叶斯。)朴素贝叶斯模型类型=多点)valpredictionandlabel=test。映射(p=(模型。predict(p . features)),p . label()val精度=1.0 *预测和标注。滤波器(x=x _ 1==x _ 2).计数)/测试。count)/ valsamemodel=朴素贝叶斯模型。加载( HDFS://名称服务1/用户/配置单元/火花/朴素贝叶斯/模型3) py sparare

  

spark-submit pyNaiveBayes.py

  # -编码:utf-8-frompyspark。ml lib。classificationimportnaivebayes,naivebayesmodelfrompyspark。ml lib。linalgimportvectorsfrompyspark。ml lib。regressionimportdfyportsparkcontent e= python pi )defparseline)line):parts=line。split)、label=float(parts[0])features=vectors .returnyydfy f特性(data=sc。textfile(HDFS://名称服务1/用户/hive/spark/data/sample _ naive _ Bayes seed=0)模型=naive Bayes。train(training,1.0)predictionandlabel=test p . label()accuracy=1.0 * predictionanand v):x==v).计数)/测试。count))count HDFS://名称服务1/用户/hive/spark/python naive Bayes/ HDFS://名称服务1/用户/hive/spark/python naive Bayes/model } 3 .python from sklear nimportnaive _ Bayes ii种子):test=[]train=[]random。种子)用于数据3360 ifrandom中的行。random m)==k:测试。追加(.加入(线))否则:火车。追加测试编号按分隔符表示分隔符2):x=[]y=[]for line in data:parts=line。split(分隔符1)x1=[float(a)for or y1x。append)x1)y . append)y1)返回x,y##读取数据data=open(e 3360/Java r )training,test=split data () ) testX, ##建模模型=朴素贝叶斯。简单的纤细(model.fit ) trainingY,trainingY ) #评估forbintestx 3360 print)型号。预测b)发布于2016-11-2211:52 HP dmb (…)注释…)编辑集合为:6

贝叶斯分类算法原理,举例说明朴素贝叶斯分类算法的应用