从大数据入门,到达到一定水平,在学习路径上有什么建议

发布网友 发布时间:2022-04-23 05:14

我来回答

8个回答

热心网友 时间:2022-05-01 01:28

目前我们正处在大数据时代,掌握大数据相关技术对提高自己的职场竞争力一定是有帮助的。

大数据学习建议:

1、0基础小白从Java语言开始学习

因为当前的大数据技术主要是用 Java 实现的或者是基于 Java 的,想入行大数据,Java基础是必备的;

2、Java开发能力需要通过实际项目来锻炼

在学习完Java语言之后,往往只是掌握了Java语言的基本操作,只有通过真正的项目锻炼才能进一步提高Java开发能力。

3、大数据开发有明显的场景要求

大数据开发是基于目前已有信息系统的升级改造,是一个系统的过程,包括平台的搭建、数据的存储、服务的部署等都有较大的变化,要想真正理解大数据需要有一个积累的过程。对于初学者来说,应该先建立一个对开发场景的认知,这样会更好的理解大数据平台的价值和作用。

4、从基础开发开始做起

对于初级程序员来说,不管自己是否掌握大数据平台的开发知识,都是从基础的开发开始做起,基于大数据平台开发环境。

从就业的角度来说,大数据开发是一个不错的选择。但我并不建议脱离实际应用来学习大数据,最好要结合实际的开发任务来一边学习一边使用。

热心网友 时间:2022-05-01 02:46

首先你要有自己职业规划,知道数据分析和大数据是做什么的、能解决什么问题,给自己定一个小目标。一个有经验的数据科学家:最少要有2到3年工作经验,而工作经验体现在运用数据科学处理各种商业问题的能力上,同时需要具备以下技能:
一流的分析技巧:探索凌乱的数据集并提取洞察的能力;
在SQL运用能力方面是一名内行;
能很好的掌握假设检验、分配、回归分析和贝叶斯方法;
有与商业方面的机器学习经验;
对于Python语言和Jupyter环境有经验;
对于pandas、numpy、sk-learn和NLTK有一定操作经验;
具备写编写Latex格式文档的能力;
在统计学,运筹学,经济学,计算机科学,或其它相关领域具有本科或硕士学历。
未来数据分析是一种工具,在金融、互联网、电子商务、公共服务、医疗健康等领域非常广泛,职位上面偏业务的有数据分析师、数据产品经理、数据规划师等职位,偏技术的有大数据工程师、大数据架构师、算法工程师等职位。你需要了解自己的兴趣和特长并选择合适的职业通道。
在大学本科阶段,没有什么比学好数学更为重要的了:先关课程包括《高等数学》《线性代数》《概率与数理统计》《数值分析》《多元分析》《泛函分析》。数学是一门基础学科,需要长时间的学习和知识积累,而且数学课程离开学校是没地方补的。其他能力大部分是可以通过其他渠道学习的:
一、数据分析技能:
数据清洗
建立数学模型
运用合适的统计方法来分析数据
运用机器学习算法
检验模型的正确与否
实现数据可视化
二、编程技能:
精通一种或多种数据分析工具(R/Matlab/SPSS/SAS)
精通一种或多种面向对角编程语言(Python、C++、Java、C#、perl 等)
其他IT公司经常需要的技能(熟悉HTML/CSS,互联网公司可能会要求)
三、数据管理技能(尤其是针对大规模数据):
hadoop(尤其是hive/HBase、HDFS和MapRdeuce)
SQL
NoSL
其他IT公司常用的数据管理技能
四、商业知识:熟悉瀑布模型和敏捷模型等软件开发模式
理解公司运行规则
对于产业所属领域有所了解
其他公司常用商业技巧
五、交流技巧(软实力):
做演讲和PPT演示来展示产品
撰写报名
懂得倾听重点信息
能够将用户的需求转换为实际产品
其他公司常用交流交往技能
作为第一批“数据科学与大数据技术”的科班学生,你们无疑是幸运的,仰望星空,你们已经走在数据科学的大路上,前途一片光明。希望你们能想老一辈统计学家和人工智能专家学习,继往开来,早日成才!

热心网友 时间:2022-05-01 04:20

你得先了解下什么是大数据 然后开始学习JAVA之类的基础语言 之后可以多看一些教学视频,当然要是有钱就去报班学习 要不就看些书,有个21天入门的大数据的 具体忘了是啥你可以搜搜。也可以去一些大数据巴士的论坛里瞅瞅多跟人交流交流心得之类的。

热心网友 时间:2022-05-01 06:12

我建议现决定个人职业发展路线,然后再决定学习路径上的情况
比如:大数据分很多岗位,大数据开发,大数据测试,大数据可视化,大数据清洗,大数据挖掘,大数据算法等很多岗位,先看看岗位i,觉得自己适合哪个方向,然后再有侧重点的学习,但是目前大数据行业应用最广泛的是大数据开发和大数据可视化,还有部分大数据测试,如果你自学能力很强,建议自学:但是如果你自学能力不强,最好还是找一个市场好一点的培训机构,系统参加下学习,比如:光环大数据,飞马训练营在市场就业口碑和课程上都很不错,你有时间可以去看看

热心网友 时间:2022-05-01 08:20

大数据前景是很不错的,像大数据这样的专业还是一线城市比较好,师资力量跟得上、就业的薪资也是可观的,学大数据面授班的时间大约半年,学大数据可以按照路线图的顺序,

热心网友 时间:2022-05-01 10:44

第一阶段为JAVASE+MYSQL+JDBC,主要学习一些Java语言的概念,如字符、流程控制、面向对象、进程线程、枚举反射等,学习MySQL数据库的安装卸载及相关操作,学习JDBC的实现原理以及Linux基础知识,是大数据刚入门阶段。
第二阶段为分布式理论简介,主要讲解CAP理论、数据分布方式、一致性、2PC和3PC、大数据集成架构。涉及的知识点有Consistency一致性、Availability可用性、Partition tolerance分区容忍性、数据量分布、2PC流程、3PC流程、哈希方式、一致性哈希等。
第三阶段为数据存储与计算(离线场景),主要讲解协调服务ZK(1T)、数据存储hdfs(2T)、数据存储alluxio(1T)、数据采集flume、数据采集logstash、数据同步Sqoop(0.5T)、数据同步datax(0.5T)、数据同步mysql-binlog(1T)、计算模型MR与DAG(1T)、hive(5T)、Impala(1T)、任务调度Azkaban、任务调度airflow等。
第四部分为数仓建设,主要讲解数仓仓库的历史背景、离线数仓项目-伴我汽车(5T)架构技术解析、*数据模型处理kylin(3.5T)部署安装、离线数仓项目-伴我汽车升级后加入kylin进行*分析等;
第五阶段为分布式计算引擎。主要讲解计算引擎、scala语言、spark、数据存储hbase、redis、ku,并通过某p2p平台项目实现spark多数据源读写。
第六阶段为数据存储与计算(实时场景),主要讲解数据通道Kafka、实时数仓druid、流式数据处理flink、SparkStreaming,并通过讲解某交通大数让你可以将知识点融会贯通。
第七阶段为数据搜索,主要讲解elasticsearch,包括全文搜索技术、ES安装操作、index、创建索引、增删改查、索引、映射、过滤等。
第八阶段为数据治理,主要讲解数据标准、数据分类、数据建模、图存储与查询、元数据、血缘与数据质量、Hive Hook、Spark Listener等。
第九阶段为BI系统,主要讲解Superset、Graphna两大技术,包括基本简介、安装、数据源创建、表操作以及数据探索分析。
第十节段为数据挖掘,主要讲解机器学习中的数学体系、Spark Mlib机器学习算法库、Python scikit-learn机器学习算法库、机器学习结合大数据项目。

热心网友 时间:2022-05-01 13:26

师傅领进门吧,看看这边,初中入门学互联网it的

热心网友 时间:2022-05-01 16:24

学习大数据分析已然成为社会的大势所趋,随着传统公司的*更新,新兴公司的数据人才增多,大数据技术显得格外的重要。当大数据的大浪凶猛袭来时,要么你冲上浪尖,做时代的弄潮儿,要么被打入海底,做鱼儿的晚餐。大数据分析与云计算的未来发展趋势和前景已经非常的广阔,参见《剖析大数据分析就业前景》、《大数据分析12大就业方向》,未来的互联网就是大数据分析和云计算的天下,大数据分析和云计算技术将是每一个 IT 人员的必备技能。很多人想要站在大数据时代的风口却无从下手,不知道去哪学习大数据分析培训,哪里的大数据分析培训课程教的好。

不用慌,我也就从零基础过来的。下面给你们分享大数据分析九点需要学习的必经之路,助你早日打通奇经八脉,年薪更上一层楼。

一、Linux系统

Linux系统的安装及常用命令的使用

Vim编辑器的基本操作与高级应用

RPM软件包管理、YUM仓库配置、源码包的安装

Linux用户与组管理、Linux文件权限管理

特殊权限SUID、SGID、Sticky Bit权限以及ACL权限

Linux磁盘管理、文件系统管理、RAID阵列、LVM卷管理

Linux进程管理、Cron与At计划任务、Linux系统引导过程

Linux备份策略、引导故障排除

二、网络系统

DHCP、NTP服务器的配置

NFS、Samba、Vsftpd文件共享服务的配置

PXE+Kickstart无人值守安装环境部署

DNS服务器的搭建(主从、缓存、子域授权、DNS视图、事务认证)

三、shell脚本编程

Shell基础、变量的赋值和调用

条件测试、运算符、编写Shell脚本

流程控制(分支结构、循环结构、选择结构、控制指令)

定义Shell函数、数组、函数的递归调用

正则表达式的应用实践

expect交互式任务通信详解

sed与awk详解

四、MySQL数据库

数据库服务软件简介、MySQL的优点、搭建MySQL数据库服务器

MySQL数据库/数据表操作、SQL查询语句(单表查询、多表查询)

MySQL数据库存储引擎、数据库索引类型、表结构、数据导入导出

密码恢复及设置、用户权限管理及撤销

常用MySQL管理工具

数据库备份与恢复、数据库增量备份(mysqlmp、xtrabackup)

MySQL 主从复制+读写分离

MySQL集群配置、MySQL-MMM配置

MySQL性能调优

先从基础并且常用的mysql数据库开始学,最后慢慢延伸到oracle和sql server。

五、高级服务

Squid缓存机制、基本代理配置、ACL访问控制

CDN分发技术原理、Squid反向Web加速应用

高性能HTTP加速器Varnish

Web前端加速(HAProxy+Varnish)

Nginx配置优化、反向代理应用、LNMP平台构建及应用部署

Nginx防盗链、Apache与Nginx的对比、rewrite以及压力测试

Web后端加速及Session共享(LNMP+Memcached)

六、监控

系统和网络监控概述

基本监控工具(sar、mpstat、iptraf等)

SNMP协议原理、SNMP配置及查询

Cacti与Nagios的安装、配置及高级应用

Zabbix工作原理及配置

主要学习zabbix,现在用的最多的就是zabbix监控。

七、集群和存储及虚拟化

IP SAN和FC SAN原理及实施

LVS和HAProxy负载平衡集群原理、调度算法分析

Keepalived高可用集群、LVS+Keepalived整合

RHCS高可用集群高级应用

LAMP、Apache虚拟主机、AWStats日志分析、Discuz!论坛搭建

Postfix邮件服务器的搭建、SMTP发信认证、Webmail及管理平台

Rsync+Crontab实现文件备份同步、网站镜像

KVM虚拟化平台构建、virsh虚拟机管理、虚拟机快速重建

八、Python开发

Python基础

Python对象及基础数据类型

Python高级数据类型

Python流程控制

文件和输入输出

错误和异常处理

函数和函数式编程

模块化编程方法

面向对象编程

Python网络编程

这个牛*的程度我也不介绍。学会这个,你要知道的是,你的工资不在是月薪,而是按小时算钱的。

九、OpenStack云计算平台

这已经是最顶级的层次了

OpenStack平台的架构介绍、安装部署、Horizon管理界面

安装配置Qpid消息中间件服务

安装配置并验证Keystone身份认证服务

安装配置Swift对象存储服务、安装Glance镜像服务、导入系统镜像

安装并管理Cinder块存储服务

OpenStack平台的网络服务安装、配置及管理

安装Cloud Controller控制器

Nova计算节点的安装/添加/删除、从命令行加载实例

安装配置Heat自动配置服务

安装和管理Ceilometer计量监控服务

以上是零基础学大数据分析的进阶过程,如果想要了解更多的知识,可以翻看之前写的文章。如果你想要成为高端实用的技术精英,如果你想要成为就业实力派,那就不要错过。

相关推荐:

《零基础学大数据分析现实吗》、《转行大数据分析师后悔了》、《大数据分析师工作内容》、《大数据分析要学什么》、《大数据分析方法》、《资深讲师分享大数据分析师职业规划》、《学大数据分析培训多少钱》

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com