R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。
R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。
要成为有理想的极客,我们不能停留在语法上,要掌握牢固的数学,概率,统计知识,同时还要有创新精神,把R语言发挥到各个领域。让我们一起动起来吧,开始R的极客理想。
关于作者:
- 张丹(Conan), 程序员Java,R,PHP,Javascript
- weibo:@Conan_Z
- blog: http://blog.fens.me
- email: bsspirit@gmail.com
转载请注明出处:
http://blog.fens.me/r-book1/
前言
终于等到《R的极客理想-工具篇》一书出版了,写书不仅是一个漫长的过程,更是知识的浓缩和再精华的过程;写书不仅把自己会的东西记录下来,还要站在读者的角度,让其他人也能看得懂;写书不同于写博客,不仅要保证超过5遍以上的审阅,还要遵守出版的各种规则,包括格式、文字、目录、图片,公式,代码,引用….
写书不是一件容易的事情,但我做到了。希望更多的朋友都能静心下来,写本自己的书。尊重知识,就是尊重你的未来。
目录
- 写书体验
- 为什么要写这本书
- 如何阅读本书
- 致谢
1. 写书体验
写一本书不难,但用心写一本书确实也不容易。一本书从选题立项开始,就有了各种规则和约束条件,选题要求市面上没有的题材;设立图书目录作为写书的大纲;定义图书的适用人群,太小众的话要是收不回印刷成本,就要作者自己掏钱出书了;内容要有质、有量、有连贯性,不能东一句西一句,更不能神侃(我是最不擅长神侃的);对于转载和引用必须包括原文出处,并得到原文作者的同意;所有图片和公式都要有编号;代码整体要对齐,代码的注释写在代码行之后;完成后提交原稿,编辑审核打回来再改,反复3次,然后校对3次 就可以大功告成了。
写完第一稿之后,我几乎花了一个月的时间来调整格式,当时都快要崩溃了。在各种规则的制约之下,才有了这本书《R的极客理想-工具篇》,我自己都不禁感叹自己的毅力。有了第一次经验,我相信第二本书就不会再这么折磨了!(其实第二本书,已经在收尾了)
我想做一负责的作者,为了帮助大家解决图书使用过程中的问题,我特别新建了一个网站, 尚书,http://onbook.me,来帮助读者答疑解惑。中文名“尚书”来源于网站域名onbook,跟图书有关,又是一个专有名词,有助于让大家记住。
网站有图书专区(http://onbook.me/book),介绍了本书的基本情况,包括序、前方、目录、勘误、代码、试读、封面、交流等几个方面内容,读者有任何问题,都可以在网站中留言,并得到我的回复。同时,网站还有视频专区(http://onbook.me/video),提供我录制的各种视频课程,包括 R, Nodejs, Hadoop, 金融量化投资 等,视频定价在0-50元之间,视频收入仅用于网站的运营成本。
买书的读者可以免费获得一张10元的视频红包,通过网站领取!
最后附上购买链接,各大网站都能买到,建议先去比比价:互动出版社,京东,当当,亚马逊
2. 为什么要写这本书
想了半天,还是本书的前言最符合!
我是一名程序员,前后做了10年的程序开发。在这10年间,我从程序员一路做到架构师,经历了太多的系统和应用。我做过手机游戏,写过编程工具;做过大型Web应用系统,写过公司内部CRM;做过SOA的系统集成,写过基于Hadoop的大数据工具;做过外包,做过电商,做过团购,做过支付,做过SNS,也做过移动SNS。以前只用Java,然后开始用PHP……如同其他程序员一样,我一度陶醉于追求各种技术的创新,但始终有一个问题困扰着我,那就是如何才能够将我所掌握的技术转变成价值?这就好比我面对着一座金山,我拥有先进的技术,可以制作各种行性能稳定、功能卓越的挖掘机器,但我不懂如何将矿石提纯,变成金子!每每看到别人利用我的技术挖掘出金子时,我只能满脸的羡慕,心中无限的不甘。
直到我遇见了R语言,我才豁然开朗。R语言为我从另外一个角度开启了宝藏的大门,也让我对自己的职业重新思考、规划,最后坚定了我向统计、金融行业的转型。如果你也存在以上的问题,不如随着本书一起进入R语言的世界,领略R语言特有的魅力,通过对R语言的学习,重新认识大数据的价值,对自己的个人价值达到更深一步的提升。
随着我与统计、金融领域的朋友交流的逐步深入,我越来越深刻地体会到,他们对R语言的实际使用也存在着很大的问题和困惑。比如,他们在某些实验室环境下,使用R语言可以很轻松、很顺利地达到预期效果,但是移植到真实环境下,面对浩瀚繁复的大数据,在使用R语言的过程出现了很多问题。这就好比同样一座金山,他们掌握着先进的提纯技术,但他们所使用的挖掘、采集工具却还停留在石器时代!使用工具的落后,使他们要面对大量R语言之外的问题,这让他们应接不暇,甚至崩溃!有的人甚至因此认为,R语言只是一种实验室语言,至少以现在的技术水平无法将它运用到现实生活中,R语言在现实生活中的广泛应用,简直是天方夜谭!
是的,如果你是一名没有计算机背景的R语言使用者的话,你在实际使用中也同样会遇到许多这样或那样的问题,这些棘手的问题让你寝食难安,尝试着通过各种方式寻求解决方案,但也许你并不知道,在计算机领域,这些问题已经早就有了成熟、有效的解决方案。
本书的内容来自我在R语言的实际使用过程中的经验总结,基本都是我在工作中使用R语言的真实记录,其中涉及计算机、互联网、数据库、大数据、统计、金融等领域,详细总结了R语言在实际使用时与Java、MySQL、Redis、MongoDB、Cassandra、Hadoop、Hive、Hbase等技术的综合运用的解决方案,具有实战性,可操作性强。如果你与R语言接触时间不长,本书可以让你看到R语言在各行业、各领域所散发的魅力;如果你在某行业使用R语言已经有一段时间了,可能在使用R语言的过程中遇到了瓶颈,本书将让你看到R语言在与其他计算机语言结合后所迸发的强大活力;如果你是技术人员,本书中具有全局观的案例实施,也许会给你带来新的启发,甚至跟我一样,对自己的职业生涯重新规划,找到新的学习、奋斗的方向;如果你是企业中的中高层管理者,在本书中你可以看到我们已经实现的技术成果,如果需要的话,你甚至可以按照书中记录的详细的操作步骤,直接在企业环境中实施,直接获利!
在此,我不得不强调,本书不是入门书,不讲R的语法,如果你想找R语言的基础语言入门知识,那么,你来错地方了。但是,如果你已经具备了一定的R语言基础,但不一定具有计算机语言背景,我将告诉你R语言在真实环境下到底都能够做什么,并且详细地告诉你怎样一步一步地实施。
在与各界R语言初学者的交流中,我发现,入门后,学习R语言最大的问题,在于如何使用R语言的众多软件包,而这方面甚至都找不到图书,只有一些网上流传的小册子。本书中涉及了30个R语言包,并结合我的使用心得及案例分析,相信会解决大家R语言入门后的困扰。
本书是“R的极客理想”系列图书的第一本,姊妹篇《R的极客理想——高级开发篇》将深入介绍R语言底层原理,并使用R语言开发出企业级的应用。
本书的使用环境涉及Linux Ubuntu和Window7两种操作系统,R语言包的 2.15.3和3.0.1两个版本,在每一节中都有明确的标识。
R语言还在不断地进步和更新,它将引导一场数据的革命,跨学科的结合是时代趋势,也是我们的机遇!
3. 如何阅读本书
本书《R的极客理想-工具篇》的思维导图:
本书的内容分为四个部分。
- 第一部分是R基础(第1~3章),介绍了为什么要学习R语言,R语言不同版本的安装,以及R语言中常用的12个软件包。帮助读者快速了解R语言的工具包、时间序列包和性能监控包。
- 第二部分是R服务器(第4~5章) ,介绍了R语言与其他编程语言的通信,以及R语言作为服务器的应用。帮助读者打通R语言与其他编程语言的通道,并实现R语言的服务器应用。
- 第三部分是数据库和大数据(第6~7章),介绍了R语言与各种数据库的通信,以及R语言与Hadoop集成。帮助读者打通R语言与各种数据库层的通道,并实现R对基于Hadoop大数据的处理。
- 第四部分是附录,介绍了Java安装、各种数据库安装以及Hadoop安装。笔者希望读者可以在不借助其他参考书的情况下,完成书中所有实例。
本书为工具书,你可以选择任何你感兴趣的章节进行阅读,每节之间没有特别的顺序要求。如果你是一名初学者,想全面掌握R语言,请按顺序阅读全部的章节。
4. 致谢
感谢机械工业出版社华章公司的编辑 明永玲(@明永玲编辑),帮助我审阅全部章节,引导我能顺利完成书稿。
感谢 谢益辉(@谢益辉),李舰(@lijian001) 2位R圈大牛为图书写序言部分,把本书推向了新的高度!
感谢 刘思喆(@刘思喆), 陈堰平(@陈堰平), 黄志洪(@tigerfish_皓岚),谢益辉(@谢益辉) ,4位好友为图书写的推荐,简而精,突出书中亮点。
感谢我的团队,林伟林、林伟平、邓一硕,让我们通过R语言走在了一起。
感谢我的家人,感谢你们对我工作上的支持和生活上的照顾!
转载请注明出处:
http://blog.fens.me/r-book1/
等有点基础了,再买本!
:-),多谢支持!
现在看你的blog都必须要翻墙了。。。
从昨天晚上 北京联通 访问,开始出现大量丢包,估计是联通 又在升级系统,要持续几天。
等你的下一本书出版。。。我一直好奇,为什么广为流传十大必学包,但没有十大必学包的书面世?
广为流传十大必学包??没听说过,哪十个包啊?
不记得了,貌似知乎还是cos上听说的
之前看过《R语言实战》以及相关R的知识,希望能看懂博主的新书。。。
有《R语言实战》的基础,这本书肯定能看懂的!:-)
不知道po主有没有关于snow这种并行包的系统介绍文章??有的话还望告知啊,谢谢。
snow包,我在开博客之前经常用,不过当时没有写详细的文章。
博主是宽客嘛?
努力成为Quant
都已经学了这么多还不能算是宽客,我晕,我得走多少路呀
写出来的东西,还远远不够。路很长,门槛很高。
以前没有体会,现在深刻体会到很多产品和方案最终卖的都是“数学”。最近在了解R,原因是帮人找一款可以做库存分析优化的产品。一番询价都发现都很贵!于是我想到了用excel加上一点统计基础知识来做分析。后来了解到,那些卖价昂贵的产品无非也是这么实现的。 在百度时,发现了R,正好以前的同学在做生化分析也会用到,所以就准备了解一下!也是正巧搜到你的网站,觉得内容非常非常的好!
过奖。R比Excel要强大的多,多学点R的知识,可以有效地解决你的问题的。
P18, g = tidy.gui() 报错:Error: could not find function “tidy.gui”。 win7 平台。怎么解决?
解决方法已找到:The function tidy_app() to replace tidy.gui() in previous versions:
tidy_app() launches a Shiny app in the browser to reformat R code. The
gWidgets interface (e.g. GTK+) is no longer supported.
这种问题直接通知作者最好。谢兄,会非常乐意帮你解答的。