人生苦短,我用Python!
By 苏剑林 | 2015-12-06 | 57246位读者 |暑假的时候,应泰迪公司之约,我为他们的书《MATLAB数据挖掘与挖掘实战》编写了姊妹版:《Python数据挖掘与挖掘实战》(还有一个姊妹版是R语言的),主要的工作内容就是编写Python的介绍,以及把书上的MATLAB代码翻译为Python版本的。我欣然接受了,一来可以兼职赚点零花钱,二来可以系统地训练一下自身的Python编程,再则,还可以体验一次MATLAB、R、Python的大PK。现在书本已经正式发行,亚马逊、当当、京东、淘宝都可以找到,我也很荣幸被列为作者之一,于是这便算是我出版的第一本书了。
本文有做广告的嫌疑,广告的确是广告,不过本文不是来推销这本书的,而是来“推销”Python的。从书本来讲,我自信本书中的Python脚本,不论是代码本身的简洁性还是从代码运行的效率来看,它都不会输于MATLAB和R语言,而且书中给的案例一般都只有几百数据,而我在设计代码的时候,会考虑代码用于数万甚至数十万的数据的分析;从实际应用来讲,我目前在公司的兼职,用Python给几千万文章进行数据分析,可见,Python在各处的表现都毫不逊色。无怪乎有人感叹:人生苦短,我用Python!
没错。人生苦短,我用Python!即便你以后不从事程序员或者数据分析工作,也可以学学Python,它会给你原来的工作带来很大的便利,不论你是一名学生、教师、科研人员、普通白领。
再回来《MATLAB数据挖掘与挖掘实战》这本书,多写几句广告,以免本文显得太短。其实这本书的多数案例来源于泰迪公司主办的三届数据挖掘竞赛,而他们的数据挖掘竞赛的赛题本身具有很明显的实际背景,因此,书中的案例说得上是实用性强,而且覆盖面很广,从任务来看,数据处理、分类、聚类、关联分析、自然语言处理等等基本内容都有;从模型来看,逻辑回归、SVM、决策树、神经网络等常见模型都有涉及。本书不一定是一本很好的书,但确实是一本很用心的书。(至少笔者的代码翻译是相当用心的哈,还有第二章Python的介绍,是笔者完全自己重写的,后面再分享给大家。^_^)
转载到请包括本文地址:https://kexue.fm/archives/3546
更详细的转载事宜请参考:《科学空间FAQ》
如果您还有什么疑惑或建议,欢迎在下方评论区继续讨论。
如果您觉得本文还不错,欢迎分享/打赏本文。打赏并非要从中获得收益,而是希望知道科学空间获得了多少读者的真心关注。当然,如果你无视它,也不会影响你的阅读。再次表示欢迎和感谢!
如果您需要引用本文,请参考:
苏剑林. (Dec. 06, 2015). 《人生苦短,我用Python! 》[Blog post]. Retrieved from https://kexue.fm/archives/3546
@online{kexuefm-3546,
title={人生苦短,我用Python!},
author={苏剑林},
year={2015},
month={Dec},
url={\url{https://kexue.fm/archives/3546}},
}
December 19th, 2015
这本书适合从零学python吗?或者哪些书适合?
其实不应该这样问。学一门编程语言,不是哪本书就够了,而是在遇到问题的时候,随时搜索就行。
本书的第二、三、四、五章,算是对python做数据挖掘的一个梗概式的介绍,其中第二章是对python的入门,基本上多数python的知识都能在里边找到,但是“够不够”就难说了,善于搜索才是关键。我也相信没有哪本书能够做到“一本书即可”。
December 30th, 2015
哇,太厉害了,都出书了哦。
你保研到哪了?
中山大学^_^
书不是我写的~~
原来是学长?!
March 7th, 2017
点赞。
March 12th, 2018
你好,我想问下,我实现了第15章节里面的机械压缩算法,但是只能处理前缀的机械压缩,想中间重复的和结尾重复的都不能处理,eg:非常好好好好好好好好,这个真的真的真的很好用。这样的句子该如何处理呢。希望大神给一点思路。
后缀重复再前缀处理完之后,再正着来一遍就好了,我再想想中间重复。
中间的也能处理了。在前缀后缀处理完之后,因为"这个真的真的真的很好用',这种句式比较有规律,就直接找最大的重复字串,replace掉出现次数的 n-1次,只留下一个就行了。
解决了就好哈,最近事情比较多,回复迟了,请见谅~
如果有什么问题欢迎再留言讨论。
April 5th, 2019
编程语言有2种,Javascript和non-Javascript。苏神有机会尝试一下最新的Javascript,不一样的体验。