王垠:数学和编程

  文/王垠

  好些人来信问我,要成为一个好的程序员,数学基础要达到什么样的程度?十八年前,当我成为大学计算机系新生的时候,也为同样的问题所困扰。面对学数学,物理等学科的同学,我感到自卑。经常有人说那些专业的知识更加精华一些,难度更高一些,那些专业的人毕业之后如果做编程工作,水平其实比计算机系毕业的还要高。直到几年前深入研究程序语言之后,对这个问题我才得到了答案和解脱。由于好多编程新手遇到同样的困扰,所以我想在这里把这个问题详细的阐述一下。

  数学并不是计算机科学的基础

  很多人都错误的认为,计算机科学是数学的一个分支,数学是计算机科学的基础,数学是更加博大精深的科学。这些人以为只要学会了数学,编程的事情全都不在话下,然而事实却并非如此。

  事实其实是这样的:

  • 计算机科学其实根本不是数学,它只不过借用了非常少,非常基础的数学,比高中数学还要容易一点。所谓“高等数学”,在计算机科学里面基本用不上。
  • 计算机是比数学更加基础的工具,就像纸和笔一样。计算机可以用来解决数学的问题,也可以用来解决不是数学的问题,比如工程的问题,艺术的问题,经济的问题,社会的问题等等。
  • 计算机科学是完全独立的学科。学习了数学和物理,并不能代替对计算机科学的学习。你必须针对计算机科学进行学习,才有可能成为好的程序员。
  • 数学家所用的语言,比起常见的程序语言(比如C++,Java)来说,其实是非常落后而糟糕的设计。所谓“数学的美感”,其实大部分是夜郎自大。
  • 99% 的数学家都写不出像样的代码。

  数学是异常糟糕的语言

  这并不是危言耸听。如果你深入研究过程序语言的理论,就会发现其实数学家们使用的那些符号,只不过是一种非常糟糕的程序语言。数学的理论有些是有用的,然而数学家门用于描述这些理论所用的语言,却是纷繁复杂,缺乏一致性,可组合性(composability),简单性,可用性。这也就是为什么大部分人看到数学就头痛。这不是他们不够聪明,而是数学语言的“设计”有问题。人们学习数学的时候,其实只有少部分时间在思考它的精髓,而大部分时间是在折腾它的语法。

  举一个非常简单的例子。如果你说x-1表示x的-1 次方(x的倒数),那么f-1表示什么?f的-1 次方,f的倒数?别被数学老师们的教条和借口欺骗啦,他们总是告诉你:“你应该记住这些!” 可是你想过吗:“凭什么!” x-1表示x的-1 次方,而f-1,明明是一模一样的形式,表示的却是函数f的反函数。一个是求幂,一个是反函数,风马不及,却写成一个样子。这样的语言设计混淆不堪,却喜欢以“约定俗成”作为借口。

  如果你再多看一些数学书,就会发现这只是数学语言几百年累积下来的糟粕的冰山一角。数学书里尽是各种上标下标,带括号的上标下标,x,y,z,a,b,c,f,g,h,各种扭来扭去的希腊字母,希伯来字母…… 斜体,黑体,花体,双影体,……用不同的字体来表示不同的“类型”。很多符号的含义,在不同的子领域里面都不一样。有些人上一门数学课,到最后还没明白那些符号是什么意思。

  很多人学习微积分都觉得困难,其实问题不在他们,而在于莱布尼兹(Leibniz)。莱布尼兹设计来描述微积分的语言(∫,dx, dy, …),从现代语言设计的角度来看,其实非常之糟糕,可以说是一塌糊涂。我不能怪莱布尼兹,他毕竟是几百年前的人了,他不知道我们现在知道的很多东西。然而古人的设计,现在还不考虑改进,反而当成教条灌输给学生,那就是不思进取了。

  数学的语言不像程序语言,它的历史太久,没有经过系统的,考虑周全的,统一的设计。各种数学符号的出现,往往是历史上某个数学家有天在黑板上随手画出一些古怪的符号,说这代表什么,那代表什么,…… 然后就定下来了。很多数学家只关心自己那块狭窄的子领域,为自己的理论随便设计出一套符号,完全不管这些是否跟其它子领域的符号相冲突。这就是为什么不同的数学子领域里写出同样的符号,却可以表示完全不同的涵义。在这种意义上,数学的语言跟 Perl(一种非常糟糕的程序语言)有些类似。Perl 把各种人需要的各种功能,不加选择地加进了语言里面,造成语言繁复不堪,甚至连 Perl 的创造者自己都不能理解它所有的功能。

  数学的证明,使用的其实也是极其不严格的语言——古怪的符号,加上含糊不清,容易误解的人类语言。如果你知道什么是 Curry-Howard Correspondence 就会明白,其实每一个数学证明都不过是一段代码。同样的定理,可以有许多不同版本的证明(代码)。这些证明有的简短优雅,有的却冗长繁复,像面条一样绕来绕去,没法看懂。你经常在数学证明里面看到“未定义的变量”,证明的逻辑也包含着各种隐含知识,思维跳跃,非常难以理解。很多数学证明,从程序的观点来看,连编译都不会通过,就别提运行了。

  数学家们往往不在乎证明的优雅性。他们认为只要能证明出定理,你管我的证明简不简单,容不容易看懂呢。你越是看不懂,就越是觉得我高深莫测!这种思潮到了编程的时候就显出弊端了。数学家写代码,往往忽视代码的优雅性,简单性,模块化,可读性,性能,数据结构等重要因素,认为代码只要能算出结果就行。他们把代码当成跟证明一样,一次性的东西,所以他们的代码往往不能满足实际工程的严格要求。

  编程是一门艺术

  从上面你也许已经明白了,普通程序员使用的编程语言,就算是 C++ 这样毛病众多的语言,其实也已经比数学家使用的语言高明很多。计算机科学并不是数学的一个分支,它在很大程度上是优于数学,高于数学的。有些数学的基本理论可以被计算机科学所用,然而计算机科学并不是数学的一部分。数学在语言方面带有太多的历史遗留糟粕,它其实是泥菩萨过河,自身难保,它根本解决不了编程中遇到的实际问题。

  编程真的是一门艺术,因为它符合艺术的各种特征。艺术可以利用科学提供的工具,然而它却不是科学的一部分,它的地位也并不低于科学。和所有的艺术一样,编程能解决科学没法解决的问题,满足人们新的需求,开拓新的世界。所以亲爱的程序员们,别再为自己不懂很多数学而烦恼了。数学并不能帮助你写出好的程序,然而能写出好程序的人,却能更好的理解数学。我建议你们先学编程,再去看数学。

本文文字及图片出自 www.yinwang.org

余下全文(1/3)
分享这篇文章:

请关注我们:

共有 18 条讨论

  1. 38节 对这篇文章的反应是赞一个
  2. 李向磊  这篇文章
  3. 王垠说的对,上小学时我就发现了,数学那套符号系统烂透了。虽然有历史原因,但是现在这套符号系统极大地阻碍了对数学的学习、研究;如果整理一套好的符号系统,同样学习数学的时间可以下降到现在的三分之一。

  4. 能明白作者的意思。
    但是那个非常简单的例子是不对的。在数学中(*)^(-1)这种符号必然由一个类似于群的结构所定义。
    比如x是非零实数,配合乘法运算下非零实数全体是一个群,x^(-1)表示x的乘法运算的逆元,也就是倒数。
    f的反函数记为f^(-1)也是同样的道理:f的反函数是f在映射复合运算下的逆元。所以才记为f^(-1)。

    不过记号(*)^(-1)并没有指明是哪种运算的逆,是有些麻烦。
    可实际上,你是可以指明的,只要换个符号就可以了。但一来没必要,因为结合上下文并不会混淆;二来书写量极大。

    另外我觉得作者所说的问题,根源并不在语言设计上,而是数学内在的复杂性。这种复杂无可避免的导致了符号繁琐。

  5. 裤衩 对这篇文章的反应是赞一个
  6. neihcop  这篇文章
  7. “数学并不能帮助你写出好的程序,然而能写出好程序的人,却能更好的理解数学。我建议你们先学编程,再去看数学。”

    1 编程离不开算法,算法要用数学分析。比如,常见的排序算法,如果要分析一下复杂度,要用到数学里的“极限”等知识。再如,图像处理算法,搜索算法,需要用到的数学知识何其之深!
    2 仅仅开发应用层的程序,可以不用掌握各种算法。比如java编程,很少会去亲自写一个排序算法,而是直接调用jdk里的方法。开发应用层的代码,从技能角度来说最在意的是提高代码的可读和可维护性。因为需要多人合作,注重商业价值,所以软件开发也是一个“工程”,它有很多工程方法。这其中有很多值得思考和专研的。
    3 把一件事情做好,比多数人好,会给我们带来优越感。然而还是要保持谦虚之心,好奇之心。世界上美好的东西远远不止编程

  8. “计算机是比数学更加基础的工具,就像纸和笔一样。计算机可以用来解决数学的问题,也可以用来解决不是数学的问题,比如工程的问题,艺术的问题,经济的问题,社会的问题等等。”

    这些东西哪一个不是通过算法解决的?CPU不过是个加法器,你如何让计算机直接去处理工程的问题,艺术的问题,经济的问题,社会的问题?就算你是个觉得只要会搭积木就可以了的程序员,你举例的这些领域也都不是仅仅拿现有的库搭建就可以解决问题的,不要信口开河。

  9. xgqfrms 对这篇文章的反应是垃圾
  10. jugl  这篇文章
  11. 无知者无畏。高水平的程序设计离不开数学和数学思维

  12. 从计算机的角度来讲,楼住说的可能有点道理
    但是楼住可能没有深入去理解过数学,所以漏洞很多,一门计算机语言是否完善本身就是个数学问题,他可以涉及到抽象数学以及完备集合的很多概念
    数学本身就是门语言
    是一种用来各种现象的自然语言,他可以在很多复杂的现象背后将你想观察的其中一种现象的规律和本质很完美的描述出来,
    并且数学是一种探索工具,是在用数学所描述的模型中通过不断的自我完善来探索和理解现象的本质。
    比如说让你通过计算机来描述股票波动,没有数学模型,这是不可能实现的,因为你根本不知道股票是如何波动的,只有通过数学这种语言对这个现象进行描述以后,你才有可能去编写它,这也是为什么说所有问题一但上升到一定高度之后,都会变成数学问题的原因,数学可以称之为目前已知最伟大的语言

  13. 桑安磊 对这篇文章的反应是垃圾
  14. 作者观点太过偏激,数学本身就是一门语言,初级码农纠结在语法上,大神纠结在算法上,一切算法都可以都可以抽象为数学模型。

  15. 刀尖红叶 对这篇文章的反应是赞一个
  16. Daniel LIN  这篇文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注