• [field:title/]
  • [field:title/]

您现在的位置: > 行业杂谈 > 香港vps中的贝叶斯算法

香港vps中的贝叶斯算法

作者:木木 文章来源:原创  点击量: 发布日期:2017-05-15

  香港vps中的贝叶斯算法

  对于有志于机器学习的香港vps的使用者来说,贝叶斯算法是无论如何也无法绕过的一道坎,由于他和数学中的概率论的内容相当紧密,对于相关原理的证明也令许多的初学者望而却步,当然大部分的读者并不是从事相关的科学研究,所以在这里我们并不进行相关的定理的证明,而是仅仅将算法的基本原理分享给大家,并给出一个简单的代码实现,希望能够给相关的读者以启发。

  贝叶斯算法是以贝叶斯的名字来命名,他证明了贝叶斯定理的一个特例。这个定理对于我们要讲到的内容来说十分关键,同时它的应用十分广泛,人们把他用于解决天体力学、医学统计中的问题,甚至可以用于法理学。更加普遍的说法是:贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯分类算法可以实现非常好的分类效果,在这一点上甚至与决策树和神经网络分类算法不相上下,该算法能运用到大型服务器中,可以以极高的效率实现相应的功能,贝叶斯方法有着许多的变形,例如朴素贝叶斯算法、树增强型朴素贝叶斯算法,在机器学习中一般是指贝叶斯分类器这一类方法。

  通常来说贝叶斯方法相对于其他的方法有以下优势:因为它最初起源于概率论的相关知识,所以有着坚实的数学基础,以及稳定的分类效率,其次所需估计的参数很少,对缺失数据不太敏感,算法实现也相对简单。对大数量训练和查询时具有较高的速度,因为在使用超大规模的训练集的时候,它会自动的对选定的实例的特征进行分解,并从中选取合适的特征数目,因此针对每个项目也只会用相对较少的特征数,而且与卷积神经网络不同,贝叶斯所训练出来的模型可以被人们较好的理解,可以通过数学的方法进行严格的证明,并且对项目的训练和分类也仅仅是特征概率的数学运算而已。支持增量式运算,可以对新增的样本进行训练。

  现在我们给出相关代码的实现:

  TrainMultiNomialNB(C,D) {

  V←ExtractVocabulary(D) //抽取向量的值赋给一个新的向量。

  N←CountTokens(D)

  for each c in C

  Nc←CountTokensInClass(D,c)

  prior[c]←Nc/N

  // 将类别c下的文档连接成一个大字符串

  textc←ConcatenateTextOfAllDocsInClass(D,c)

  for each t∈V

  // 计算类c下单词t的出现次数

  Tct←CountTokensOfTerm(textc,t)

  for each t∈V

  //计算P(t|c)

  condprob[t][c]←

  return V,prior,condprob //返回计算的最终结果。

  }

  ApplyMultiNomialNB(C,V,prior,condprob,d) {

  W←ExtractTokensFromDoc(V,d)

  for each c in C // 对于集合中的每一个元素都进行运算,将结果赋予到一个新的数组之中。

  score[c]←prior[c]

  for each t∈W

  if t∈Vd

  score[c] *= condprob[t][c]

  return max(score[c])

  }

  服务器中的贝叶斯算法小编就带领大家介绍到这里了。

  如果您还有什么不明确或者是不懂的地方,欢迎来新世界主机咨询了解,详情请咨询QQ: TEL: 。我们必将竭诚为您服务。

本文地址: http://xgvps.com/xingyezatan/435.htm
版权所有*转载时必须以链接形式注明作者和原始出处

网站首页|关于我们|诚聘英才|合作伙伴|法律申明|诚招代理|联系我们|网站xml地图

Copyright © 2001-2020 香港vps 网址:http://xgvps.com/

香港vps、香港服务器、香港vps主机、香港vps哪里好、就到香港新世界vps主机。

信息来源于网络以及网友投稿,如侵犯了您的权益,请及时通知本站。 

收缩
p