自然语言处理实战 豆瓣,基于自然语言处理的应用
资源http://www.52nlp.cn/resources提供了52nlp博客的几个系列文章和收集的书籍下载以及其他与自然语言处理相关的资源,正在陆续整理中!有问题就删!
特别推荐系列:
1、HMM学习全文文档的最佳范例百度网盘链接:http://pan.Baidu.com/s/1 PJ OMA2B密码:f7az
2、无约束优化全文文档-by@个性豌豆、百度网盘链接:link:3358 pan.Baidu.com/s/1 HQEJTT 6密码:qng0
3.Python自然语言处理的中文翻译-NLTKNaturalanguageProcessing用PYTHON中文版,沉默币sean免费翻译。链接:http://pan.Baidu.com/s/1 i3 DVWFV密码:oxne
4.正态分布前世(pdf版(-by@rickjin
5.总结LDA-math-LDA数学八卦作者@ Rick Jin
6.如何计算两个文档的相似度?
7.中文分词词条注释全文文档
一.书籍:
055-79000英文版第二版
2《自然语言处理综论》英文版
3,《统计自然语言处理基础》,NLTK机顶盒
4,《用Python进行自然语言处理》,介绍Python的经典书籍,包罗万象。
5, 《Learning Python第三版》
6, 《自然语言处理中的模式识别》
7, 《EM算法及其扩展》
8,010-3010英文版(好像只有前九章))。
9,《统计学习基础》,虽然质量不是很好,但是第六章关于HMM的部分比较详细,作者之一是劳伦斯拉比纳;
10.一本经典的概率统计入门书:《自然语言理解》(英文版,不小心黑裤子)))))))))))))))))。
一两卷DjVuLibre reader(阅读前两卷需要)。
1.使用Perl和Prolog处理自然语言入门书籍:《Fundamentals of Speech Recognition》
12.国外机器学习书籍:
1) 《概率论及其应用》,机器学习数据挖掘领域,近几年出版的很好的入门书,是培养兴趣最重要的部分。乍一看,大多数人很容易被吓到”
2) 《programmingcollectiveintelligence,中文译名《An Introduction to Language Processing with Perl and Prolog》,机器学习领域无可争议的经典著作。下载后,只需将后缀改为pdf即可。lmdwx对豆瓣的评论):旧书,牛逼的人。虽然内容现在看起来不算太深奥,很多章节都有到此为止的感觉,但是适合初学者在不知道“当然不能‘新’”的算法和概率的情况下入门。比如决策树部分就很棒。这几年没有什么特别的进展,所以用不了多久。另外,这本书是1997年之前几十年机器学习的大综述,参考书目极具价值。国内有翻译版和影印版,不知道有没有绝版。
3)“机器学习导论”
13.海外数据挖掘书籍;
1) 《机器学习》,数据挖掘经典著作作者3:韩/Micheline Campbell出版社:mor gan kaufmann kon
2)数据挖掘3360实用机器学习工具和技术
3)漂亮的数据:thestoriesbehindelegantdatasolutions(tobysegaran,Jeff Hammerbacher)。
14.国外模式识别书籍;
1)“模式记录”
2)模式识别技术及其应用
3)“感应模式识别”
4)“互联互通”
5)《统计数据分组第二版》
6)“被监督和未被监督的模式识别”
7)“supportvectormachinesforpatternclassification”
15.国外人工智能书籍;
1)人工智能:AMODERNAPROACH(第2版)是人工智能领域无可争议的经典。
2)人工智能编程范例
16.其他相关书籍:
1)对语义进行编程
ic Web,托比塞格兰,科林埃文斯,杰米泰勒
2)学习。Python第四版,英语
二、课件:
1.哈工大raddy老师的《统计自然语言处理》课件;
2.哈工大wrdlz老师的《自然语言处理》课件;
3.中科院计算所粗鲁航空老师的《计算语言学讲义》课件;
4.中科院自动化所宗成庆老师的《自然语言理解》课件;
5.北京大学常宝宝老师的《计算语言学》课件;
6.北京大学詹卫东《中文信息处理基础》课件及相关代码;
7.麻省理工学院教授Regina Barzilay的《自然语言处理》课件,在52nlp上翻译了前五章;
8.麻省理工学院丹尼尔杰姆迪柯林斯的“自然语言处理的机器学习方法”课件;
9.jmddy Collins的“机器学习”课件;
10.SMT牛人Philip Koehn的《高级自然语言处理》课件;
1.菲利普科恩的“自然语言处理中的情感方法”课件;
12.菲利普科恩《机器翻译》课件;
三。语言资源和开源工具:
1.棕色文集:
a)XML格式的棕色语料库,带有词性标注;
b)普通文本格式的棕色语料库,带有词性标注;
c)合并并移除用于词性标注训练的行首的空白行和空格:browntest.zip
2.NLTK官方提供的语料库资源列表
3.OpenNLP上的开源自然语言处理工具列表
4.由斯坦福大学自然语言处理小组维护的统计自然语言处理和基于语料库的计算语言学资源列表。
5.LDC上的免费中文信息处理资源
6.中文分词相关工具:
1)Java版的mmseg: MMSEG:mmseg-v0.3.zip,solol写的,具体请参考:《data.mining.concepts.and.techniques.2nd》。
2)成就蓝天老师ICTCLAS2这个版本是非商业的,免费一年。:
http://cid-51de2738d3ea0fdd.skydrive.live.com/self.aspx/.public/ictclas 2010-packet-release . rar
7.热