读书数学之美 - 吴军0字 下载全书Google吴军 内容简介 也许大家不相信,数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应用数学工具解决一个语言问题时,总会感叹数学之美。我们希望利用Google中文黑板报这块园地,介绍一些数学工具,以及我们是如何利用这些工具来开发Google产品的。 一 统计语言模型 二 谈谈中文分词 三 隐含马尔可夫模型在语言处理中的应用 四 怎样度量信息? 五 简单之美:布尔代数和搜索引擎的索引 六 图论和网络爬虫 七 信息论在信息处理中的应用 八 贾里尼克的故事和现代语言处理 九 如何确定网页和查询的相关性 十 有限状态机和地址识别 十一 Google阿卡47的制造者阿米特.辛格博士 十二 余弦定理和新闻的分类 十三 信息指纹及其应用 十四 谈谈数学模型的重要性 十五 繁与简 自然语言处理的几位精英 十六 不要把所有的鸡蛋放在一个篮子里 十七 闪光的不一定是金子 谈谈搜索引擎作弊问题 十八 矩阵运算和文本处理中的分类问题 十九 马尔可夫链的扩展 贝叶斯网络 二十 自然语言处理的教父 马库斯 二十一 布隆过滤器 二十二 由电视剧《暗算》所想到的 二十三 输入一个汉字需要敲多少个键 二十四 从全球导航到输入法——谈谈动态规划这是第一篇一 统计语言模型