怎样进行大数据的入门级学习

如题所述

1R programming
如果只是想初步了解一下R语言已经R在数据分析方面的应用,那不妨就看看这两本:
R in action:我的R语言大数据101。其实对于一个没有任何编程基础的人来说,一开始就学这本书,学习曲线可能会比较陡峭。但如果配合上一些辅助材料,如官方发布的 R basics
2Python
Think Python,Think
Stats,Think Bayes:这是Allen B. Downey写的著名的Think X
series三大卷。其实是三本精致的小册子,如果想快速地掌握Python在统计方面的操作,好好阅读这三本书,认真做习题,答案链接在书里有。这三本书学通了,就可以上手用Python进行基本的统计建模了。
3Exploratory Data Analysis 和 Data Visualization
Exploratory Data
Analysis:John
Tukey写于1977年的经典老教材,是这一领域的开山之作。如今EDA已经是统计学里的重要一支,但当时还是有很多人对他的工作不屑一顾。可他爱数据,坚信数据可以以一种出人意料的方式呈现出来。正是他的努力,让数据可视化成为一门无比迷人的技术。
4Machine Learning Data Mining
这一块就不多说了,不是因为它不重要,而是因为它太太太重要。所以这一部分就推两本书,都是”世界名著“,都比较难读,需要一点点地啃。这两本书拿下,基本就算是登堂入室了。其实作为机器学习的延伸和深化,概率图模型(PGM)和深度学习(deep
learning)同样值得研究,特别是后者现在简直火得不得了。但PGM偏难,啃K.Daphne那本大作实在太烧脑,也没必要,而且在数据领域的应用也不算很广。deep
learning目前工业界的步子迈得比学术界的大,各个domain的应用如火如荼,但要有公认的好教材问世则还需时日,所以PGM和deep
learning这两块就不荐书了。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2019-05-24
我们都知道现在大数据很火,很多小伙伴也在学习大数据的方法,比如说:怎样进行大数据的入门学习?
对于大数据的入门学习,基础不一样,起点就会不一样,今天先来说说,对于零基础的同学想要学习大数据的方式方法吧!很多人可能感到不可思议,零基础怎么可能学习大数据,没有编程基础怎么能入门呢?其实这个观点是很正确的,对于大数据的开发而言,是需要一定的编程基础的,所以我们的大数据入门级课程就落在了编程语言的学习。

现在一般的大数据入门课程,都是从编程语言开始教授的,但请你一定要认清一个问题,编程语言只是大数据课程的一小部分,如果整个大数据的课程一大部分都是编程语言的教授,你就要小心了,这真的不是真正的大数据课程。还有一些“戏精”机构以HTML5、Java、大数据可视化等擦边知识, 混淆真实大数据授课标准课程,蒙蔽学员,发现时才追悔莫及。我们总结以下假课,避免学员入坑。
不靠谱的大数据学习课程总结如下:
1、大数据偏HTML5
课程偏重HTML5、css、HTMl、AJAX、jQuery、AngleJs、Js等内容讲解。
2、大数据偏Java
课程偏重Java、JavaWeb、Spring、SpringMVC、MyBatis、HTCargo项目实战。
3、大数据偏大数据可视化
课程偏重Photoshop、Javascript及可视化工具,就职大数据运维工程师。薪资低、就业慢,岗位少。
4、大数据偏测试课程
课程偏重数据库管理系统(DBMS)、VBScript脚本语言等。
靠谱的大数据学习课程如下:
靠谱的大数据学习课程,要让学生掌握计算机技术、hadoop 、spark、storm开发、hive 数据库、Linux 操作系统等知识,具备分布式存储、分布式计算框架等技术,熟悉大数据处理和分析技术。
其中,大数据生态体系的各个模块的功能和开发技术,包括 Hadoop 体系中的 HDFS, Hbase 进行数据操作,MapReduce 进行数据开发,YARN 进行资源配置,Hive 完成数据仓库,Pig进行数据分析,以及 Oozie,Zookeeper,Sqoop 和 Flume 等模块。还有Spark 生态体系的学习,及其 Scala 基础和 SparkSQL 开发。
话不多说了,想要学习大数据的,快开始行动吧!