本文核心词:数学之美。
数学之美读后感
数学之美读后感(一)
我第一次看到这本书是在两三年前,当时看的是电子书,虽然没太仔细看,但是第一次近距离了解到这些互联网应用背后的数学原理。
前段时间,我在小孙同学的桌上看到了《数学之美》的纸质书,就向他借来读。虽说“书非借不能读也”,但实际上借了书也没能好好读,断断续续读了有一个月才读完。
由于工作背景的缘故,吴军博士的这本书主要内容集中在语言识别和搜索领域,但这丝毫不妨碍它确实反映了很多共同的道理。我总结了几点供大家探讨。
1. 简单就是美
欧拉公式,最美的数据公式之一。
虽然在大家的眼里,数学是一门深奥的学科,但是很多数学规律却能用非常简单的公式表示出来。我想“简单却非常有用”或许就是数学之美的内涵吧。
书中作者给了很多“简单却非常有用”的例子,比如简单的布尔代数就是搜索引擎的数学基础;比如助Google一举逆袭成为搜索老大pagerank算法就是矩阵乘法迭代结合TF-IDF公式;地图导航搜索就是简单的动态规划;统计语言模型可以轻松解决看似难度、复杂度超高机器翻译、语音识别。
数学的精彩之处就在于简单的模型可以干大事。从本质上讲,数学的思维方法就是抽象与简化。简单的模型怎么来?靠的是先抽象,后简化。对于复杂的问题,往往可以通过抽象,然后用数学模型来描述它。选择了合理的模型就成功了一半。但是有了模型,往往模型看着简单,但求解比较困难。这就需要合理假设继续简化,或者说通过增加合理的假设条件来简化计算。以书上提到的马尔科夫链为例,虽然公式的求解非常困难,但是一旦加上适当的假设,问题就一下子简化了非常多。
所以,针对纷繁芜杂的现实情况,我们一定要能时刻准备着把复杂问题简单化,一定要做到大胆合理假设,尽可能的简化问题,抓住其主要矛盾,先用很小的代价解决大部分的问题,剩下的部分再分步解决。
2. 透过现象看本质
作者说到,技术分为术和道两种,具体的做事方法是术,做事的原理和原则是道。技术容易学,但也容易落伍,所以追求术的人一辈子工作很辛苦,只有掌握了道的本质和精髓才能永远游刃有余。真正做好一件事没有捷径,需要一万小时的专业训练和努力。
道是什么?道实际上就是方向,就是判断。
我想有些领导之所以成为优秀的领导,是因为他们掌握了道,反而对具体的术不那么关注。
举个书上的两个例子,都是关于搜索的:一个例子是搜索的本质是什么?自动下载尽可能多的网页;建立快速有效的索引;根据相关性对网页进行公平准确的排序。另一个例子是搜索引擎作弊的本质是什么?是在网页排名信号中加入了噪声,因此反作弊的关键是去除噪声。
所以,我们在工作的时候,要善于理解事物的原理与本质。要先回答是什么、为什么?最后才是怎么做。再比如,在学习某个软件或某项技术时,就需要先掌握它的工作原理与工作机制,以便于我们判断其适用的场景和不适用的场景,而不是先去熟悉怎么用它。
3. 循序渐进、逐步演化
书上对自然语言处理着墨很多。最初的自然语言处理是基于规则的句法分析,但是一段时间过后,人们发现句法分析的准确率很难提升。正当句法分析派走投无路的时候,统计语言模型出现了,而且越走越顺,很快就把句法分析派远远抛在了后面。问题就来了,那为什么最开始科学家们不直接研究统计语言模型?答案当然是不能,原因是时机还不成熟,因为统计语言模型所需要基于的大数据量的语言库还没有,大规模并行计算的’能力还不够。同样的,统计语言模型就是最好的吗?当然是不尽然,科学家们现在开始研究基于深度学习的自然语言处理,相信不久的将来,语言识别、机器翻译会有另外一个质的飞跃。
我们做什么事情都不可能是一蹴而就,一步到位,想毕其功于一役的往往最后的结局都是失败的。
对我们团队而言,不管是架构规划也好、系统建设也好、管理工作也好,更是需要找准突破口,循序渐进,逐步演化。当然,我们也不能固步自封、墨守成规。
数学之美读后感(二)
看数学之美,悟技术之道
周旭龙
一、关于此书
数学之美
记得几年前看完了《浪潮之巅》之后,便知道了吴军老师还有另外一本非常出名的著作《数学之美》,但是一直没有列入计划阅读。直到2016年我看完了《硅谷之谜》以及《智能时代》之后,便自己上网买了一本第二版的《数学之美》。正如李开复博士所说:“在我认识的顶尖研究员和工程师里,吴军博士是极少数具有强大叙事能力和对科技、信息领域的发展变化有很深的纵向洞察力,并能进行有效归纳总结的人之一。”,正是因为在前面几本书中我看到了吴军老师强大的“讲故事”的能力,他能用通俗易懂,深入浅出的语言将技术原理讲清楚,这就十分腻害了,在《数学之美》中他也再次展示了这一点。
最近除了阅读《数学之美》,还订阅了吴军老师的《硅谷来信》,每天在早上洗漱时听一封信,在睡觉前也会听一封信,借吴军老师之眼去看世界,也可以读到一流的科学家/工程师对于各种事件非常独特的见解,以丰富自己的眼界。在此,感谢之前Sobey公司的我的前老板刘总的推荐,我也将《硅谷来信》推荐给你们(可以利用你们的碎片时间来学习)。
二、看数学之美
Part 1 简单即是美的方法
这本书一共29章,主要介绍了这些数学方法:统计方法、统计语言模型、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、句法分析、维特比算法、各个击破算法等。
例如,在统计语言模型一章中,我们会发现原来使用简单的数学模型就可以解决复杂的语音识别、机器翻译等问题,但是使用很复杂的文法规则和人工智能却做不到,而这些仅仅需要我们了解概率论和统计学的知识就可以应用到工程中。(当然,最先提出将统计学方法应用到计算机应用工程问题的先驱们是真的值得我们为其鼓掌的!)此外,简单的布尔代数就是支撑搜索引擎索引的数学基础,一个漂亮的pagerank矩阵乘法迭代加上一个TF-IDF公式,就可以大程度地改善搜索结果的质量,()无一不体现出简单即是美的特点,而数学模型刚好符合这个要求。
又如,在信息的度量和作用一章,我们再次回顾了信息熵的重要性,这也是吴军老师一直在重复提及的信息论(吴军老师喜欢站在信息论的高度看问题,而不只是看到片面的表象)。一个事物内部会存在随机性,也就是不确定性,而从外部消除这个不确定唯一的办法是引入信息,而需要引入的信息量取决于这个不确定的大小。就像我们在追一个女生的时候,很多时候往往不是一拍即合,一见钟情的,只有互相表达的信息(即引入信息)足够了,才会消除各自对于对方的顾虑。等到引入的信息量消除了处在两个人之间的屏障,那么我们就可以跟对方告白宣告在一起了。
本书中介绍的所有的这些方法在吴军老师的笔下都只为了突出一句话:数学的精彩之处就在于简单的模型可以干大事。
PS:对于书中提到的大部分的数学模型都有其开源的代码实现,而我们这些工程人员只需要使用这些开源工具到自己的实际项目中即可,么么哒!
Part 2 传道授业的专家们
这本书除了在高层讲述数学方法在计算机应用(主要是语音识别等互联网应用领域)的基本原理(吴军老师称其为“道”)外,还穿插了一些传道的专家们的故事,包括:贾里尼克、辛格、马库斯以及维特比等。
比如,吴军老师的博士生导师贾里尼克教授。贾里尼克教授少年坎坷,也并非开始就投身到自然语言方面的研究,关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生,对于学生的教导,教授告诉你最多的是“什么方法不好”。这让我回想起当年看李开复博士的《世界因你而不同》一书中听到的一句话(李开复博士的导师罗迪教授给李开复讲的一句话)“我不赞同你,但我支持你”,于是也就有了李开复在语音识别领域的一鸣惊人的成就。贾里尼克的一生富于传奇色彩,先在哈佛大学、康奈尔大学教书,接着在IBM任职,之后又去约翰-霍普金斯大学教书。他的贡献主要有如下几个:第一,提出了统计语言识别的框架结构;第二,共同提出了BCJR算法;第三,领导建立了世界著名的CLSP实验室。
又如,辛格博士现任主管Google搜索的高级副总裁,并被学术界公认是当今最权威的网络搜索专家。他奉行简单的哲学,并一直坚持寻找简单有效的解决方案。令我印象最深刻的就在于,吴军博士在设计分类器时,依照吴军力求完美的态度,应该还会花很多时间去尽善尽美,但是被辛格博士止住了,“在工程上简单实用的方法最好”。这种做事情的哲学其实非常值得我们借鉴,即先帮助用户解决80%的问题,再慢慢解决剩下的20%的问题,是在工业界成功地秘诀之一。许多失败并不是因为人不优秀,而是做事情的方法不对,一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。在我们的日常工作中也是一样,在项目开发设计中,很多人不管业务场景和技术要求,一上来就这种架构那种模式,往往不考虑到底这种设计是不是大牛拉小车,最后虽然解决了问题但是交付时间被延后,既让用户不满意也让部门不满意。
三、悟技术之道
吴军老师在《数学之美》中提到:“这本书的目的是讲道而不是讲术。很多具体的搜索技术很快会从独门绝技到普及,再到落伍,追求术的人一辈子工作很辛苦。只有掌握了搜索的本质和精髓才能永远游刃有余”。回到我们日常的开发工作中,作为IT工程师,程序员,要跟上技术的大潮流,需要学习的技术太多太多,如果一味地只为去追技术的脚步,那么我们也会很累很累,而且可能会是花了80%的时间却只得到了20%的效果,更别谈期望值最大化了,或许根本就达不到你期望值的60%。相反,比如cnblogs(博客园)在招聘工程师一直提到的“3大原理,2个协议,1种结构”(计算机原理、操作系统原理、编译原理、TCP/IP协议、HTTP协议、数据结构)却是没有怎么变化的(甚至是短时间不会变化的),而这些东西恰好是在这个浮躁的社会,我们这些所谓的计算机系的毕业生,所谓的科班毕业生所缺乏的(因为大部分人都没有在大学期间将这些东西真正地学好,而只是为了所谓的几个学分去图书馆奋战一两个周末而已)。站在高处向下看,也许我们一直看不到底,但是站在底处却是可以看见底的,这也是我为什么在毕业之后还要去重新温故操作系统原理和数据结构等科目的原因。
愿我们能够在底层站的更稳后,能够以一种更加全局的视角去看待上层建筑,感悟技术之道!
数学之美读后感(三)
《数学之美》,读来确实有感:数学美。
――邓毅雄
吴军博士的《数学之美》
读来确实有感:数学美。
――邓毅雄
这本书,主要涉及自然语言处理、网络搜索引擎等问题,介绍解决问题的数学方法,这些方法基本不属高大上,用到的数学知识并不复杂,有的甚至属中等数学,如余弦定理。像较好解决复杂的自然语言识别与翻译的统计方法,只是条件概率与马尔可夫链的应用;解决网页排名的PageRank算法,其核心是数学的n维向量和数值计算中的迭代法;密码学中的公开密钥方法,仅仅是较大素数的乘、除运算而已,等等。复杂的现实问题,简单的数学方法,彰显数学之韵味和数学之美。
数学之美
数学之美,源自数学的概括与抽象。而数学的抽象,又恰恰是许多人难以接受数学之梗阻。所以,一般来说,能够欣赏到数学之美,必有一定的数学基础。不过,吴军的《数学之美》,语言通俗,略沉心境,顺利读懂其要义,应该是不难的事。有这种说法,真正的大师,能够将复杂的东西,通俗表达。这话我不尽信,但也确实佩服那些把数学理论通俗易懂、形象生动描述的专家,读了《数学之美》,觉得吴军博士不错。
人类发明了许许多多的语言,如自然语言(包括各国各民族的语言)、音乐、绘画等,数学也是一种语言。读懂各种语言,需要下一定功夫,只是有些语言本身比较通俗,功夫不用太深,但像数学这样的语言,数字化,符号化,抽象化,逻辑化,难言大众望而生畏,也着实不少人望而却步。如果我们的数学老师们,能够将这些“化”都“简化”,或者尽量简化些,那是不是有更多的人有迎难而上的勇气呢?也许吧!然而,毕竟数学除了作为工具性角色,还要培养和训练人的思维,一味地简化和通俗,那种逻辑思维的特征要素,失之亦可惜呀。前些日,读了保罗.洛克哈特(美国)的《度量:一首献给数学的情歌》,其对形状和运动的度量叙述,非常通俗,给人启发,但对我这数学背景出身的人来说,因思想深处固守那份对抽象性和逻辑性的呆痴,而总感觉其味不够,犹如爱好辣味的江西人,怕不辣二无味。
五世纪著名数学评论家普洛克拉斯说:“哪里有数,那里就有美”。我国著名数学家华罗庚说:“就数学本身而言,是壮丽多彩、千姿百态、引人入胜的……认为数学枯燥乏味的人,只是看到了数学的严谨性,而没有体会出数学的内在美。”数学之美表现丰富,如美的形式符号、美的公式、美的曲线、美的曲面、美的证明、美的方法、美的理论等。从内容来说,数学之美有可分为结构美、语言美与方法美,数学也有简洁之美、对称之美、和谐之美。罗素说,数学的美,“是一种冷而严肃的美”。所以,欣赏数学的美,是需要一定能力和技巧的。
数学的应用,也是数学美的特征。科学发展到现在,数学应用无处不在,数学应用的方法很多。一个数学的抽象,包含了无穷的客观现实。解决问题,尽量方法简单,能简不繁,是一种原则。数学应用之美,就在于简单,在于巧妙,在于效奇。
作者:邓毅雄