广州大数据培训班
广州大数据培训班
- 上课时段:详见详情
- 教学点:1个
- 开班时间:滚动开班
- 课程价格:请咨询
- 已关注:748
- 优惠价格:请咨询
- 咨询电话: 400-008-6280
大数据是一种在获取、存储、管理、分析等方面大大超出了传统数据库软件工具能力范围的数据集合。它具有大量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。 未来大数据相关人才缺口巨大。
大量优质岗位等你来
薪资待遇随工作年限呈阶梯式上涨
只有想不想学,没有能不能学
理论、实战双向并行,奠定入行扎实基础
第一阶段 Java语言基础 | Java语言基础: Java语言入门、基本语法、面向对象、常用API、异常、集合、IO流、多线程、网络编程、反射、JDK新特性、MySQL数据库、JDBC 培养方向: 了解Java语言的特征和应用领域;掌握JDK、JRE和JVM的作用;能够成功搭建Java开发环境;完成HelloWorld程序的编写;掌握IDE工具IDEA的使用方式; 掌握Java基本语法中的常量、变量的声明和使用;掌握Java中的运算符、数据类型及其相互转换;掌握分支结构、循环结构、方法的定义和使用;掌握数组的使用,理解数组的内存结构; 掌握面向对象的编程思想;掌握类和对象的定义和使用;理解封装、继承、多态等特性;掌握抽象类、接口的特点和使用方式;充分理解并运用Java面向对象思想来进行程序开发; 掌握Java中的常用类和工具类的使用,能够使用这些常用类和工具类解决多种问题; 掌握Maven项目构建和依赖管理、掌握Maven的继承和聚合; |
第二阶段 Hadoop技术栈 | Hadoop技术栈 Linux、Hadoop、ZooKeeper、Hive、HBase、海王星大数据金融平台 培养方向: 掌握Linux操作系统安装及常用命令;掌握shell脚本编程; 掌握大数据架构Hadoop原理及编程应用;掌握Hadoop三大组件的使用方式、方法以及Hadoop调优; 掌握ZooKeeper协管理器工作机制以及动态感知原理及使用; 掌握Hive数据仓库的使用及调优原理; 掌握HBase数据库的开发、使用以及调优; 掌握消费金融业务处理流程;掌握根据业务制定合理技术框架(技术选型)的能力;大量数据的日志采集方案;数仓的分层搭建以及数仓建模;掌握大量数据的ETL处理方式;掌握工作流调度解决方案;掌握即席查询工具使用及其原理;掌握数据可视化报表工具的使用;掌握数据治理框架的原理以及使用;掌握集群指标监控工具的使用 职业方向: Hadoop开发工程师、数据仓库工程师、ETL开发工程师、离线开发工程师 |
第三阶段 Spark技术栈 | Spark技术栈 Scala、Kafka、Spark、交通流量实时可视化大屏 培养方向: 掌握Scala基本语法和进阶的使用,为学习Spark、Flink框架打下基础; 掌握消息队列概念、Kafka原理架构、日志合并、消息检索; 掌握分布式内存计算、RDD、DataSet、DStream概念; 掌握离线计算、流式计算; 掌握可视化大屏内在价值与用途;掌握实时流数据分析业务处理流程;掌握Flume+Kafka+Sparkstreaming+Redis架构整合;掌握Springboot的使用;掌握websocket操作使用;了解Echarts的使用方式 职业方向: Spark开发工程师、实时开发工程师 |
第四阶段 Flink流式处理框架 | Flink流式处理框架: Flink、ClickHouse、畅游天涯旅游实时分析项目 培养方向: 掌握Flink的原理;掌握Flink的使用以及与其他技术的整合; 掌握ClickHouse架构、速度快的原因;掌握ClickHouse数据库和表引擎;掌握ClickHouse基本操作以及和spark、flink的整合; 掌握旅游行业业务流程;掌握Flink在实时计算业务中的使用;掌握自定义Flink source和sink来生成和消费Kafka数据;掌握Flink和ClickHouse整合已存储数据;掌握搜索引擎Elasticsearch;掌握Flink和Elasticsearch整合;掌握基于Flink CEP处理复杂事件 职业方向: Flink开发工程师、实时开发工程师、实时数仓工程师 |
第五阶段 项目实战 | 项目实战: EWR消费信用风险舆情系统、Monoceros物流大数据平台、物流Kubernetes+Docker项目迁移 培养方向: 掌握信贷金融业务处理流程;掌握根据业务制定合理的技术框架(技术选型);掌握当下流行的数据中台概念;掌握前台工作整体机制以及技术应用;掌握后台综合分析展示应用系统;掌握大量数据的综合采集方案;掌握大量数据的ETL处理方式;掌握工作流调度解决方案;掌握集群指标监控工具的使用; 掌握基于亿级订单的物流大数据平台的研发;掌握基于Flink实现仓库货物、仓储车运动轨迹、包裹追踪等多维度业务分析;具备基于HDP平台收集数据资源的能力,实现秒级OLAP分析; 掌握Docker容器化技术以及应用;掌握Kubernetes核心功能以及在项目中的部署应用 职业方向: 数据仓库工程师、ETL开发工程师、离线开发工程师、实时开发工程师、数据中台工程师 |
第六阶段 就业指导 | 就业指导: 企业面试前期准备与技巧、专业指导、企业面试复盘 课程内容: 职业规划讲解、简历注意事项详解、就业情况分析简历制作(个人技能、项目经验、自我评价); 简历审核修正、常见面试题的讲解、技术简历的指导与优化、强化实战项目(项目模块的介绍,业务流程的梳理); 真实面试复盘(晚自习时间)(总结学员面试中的问题,进行针对性的辅导以及相关面试题的讲解) 培养方向: 从简历、面试技巧等层面助力学员,培养学员沟通表达能力 让学员清晰了解职业发展规划,明确自身定位,找到适合自身发展的工作; 通过项目强化、面试专项指导、面试复盘等,学员能更好就业 |
一路暖心服务,不怕您货比三家
大数据培训资料
在当今社会中,广泛的数据收集是任何企业的获取信息的基本来源,但从这些数据中心能够精准的获得有价值的信息并不是一件容易的事。
除非我们处理数据,否则数据对我们来说没有任何价值。这时候呢,我们就要用到一些神奇的大数据软件来快速的转换和分析数据。
下面,我将给大家介绍在【2020年度排行】中炒鸡好用的几款大数据神器!
阿帕奇Hadoop
毫无疑问,Apache Hadoop是最受欢迎的大数据工具。它是一个开放源代码框架,允许用户处理大量数据并在现有数据中心中的商品硬件上运行。
根据Apache许可,Apache Hadoop是免费的。
主要特点:
云基础设施
支持其他模型以在此框架上工作的库
MapReduce-用于处理大数据的模型
HDFS-分布式文件系统,允许保存任何类型的数据
高度可扩展
高效灵活的数据处理
阿帕奇风暴
Apache Storm是一个免费的分布式实时框架,支持任何编程语言。它是用Java和Clojure编写的。Apache Storm可以处理和转换来自不同来源的数据流。
这个大数据工具是免费的。
主要特点:
容错的
每个节点每秒可处理一百万条100字节消息
与任何编程语言集成
快速且可扩展
确保处理每个数据单元(至少一次或恰好一次)
RapidMiner
RapidMinder是一个开源的跨平台大数据工具。它集成了数据科学,预测分析和机器学习技术。它提供了一系列产品,使您能够构建新的数据挖掘流程。
该工具可在各种许可下使用。免费版为用户提供1个逻辑处理器和多达10,000个数据行。Rapidminer的商业版本起价为每年$ 2.500。
主要特点:
完善的云集成
易于共享的交互式仪表板
与内部数据库集成
建立和验证预测模型
多种数据管理方法
基于大数据的预测分析
支持客户端-服务器模型
Qubole
Qubole是一个自主的大数据平台。根据您的活动,它可以学习,优化和管理数据。数据专业人员可以只专注于继承业务任务,而不是管理框架。
Qubole是一种基于订阅的工具,主要为具有多个用户的大型企业而设计。价格从每月199美元起。
主要特点:
针对云进行了优化
高灵活性
易于使用
开源引擎
自动引入程序,避免重复手动操作
可操作的警报,见解和建议,可优化可靠性,性能和成本
Tableau
Tableau是用于商业智能和数据分析的数据可视化工具。该软件包含三个主要产品:
Tableau Desktop-适合分析师
Tableau Server-适用于企业
适用于云的Tableau Online
这个大数据工具可以处理所有数据大小。通过Web连接器启用实时数据可视化。它很容易使用。
Tableau提供免费试用。订阅价格从每月35美元起,具体取决于版本(台式机/服务器/在线)。
主要特点:
实现实时协作,
用户可以创建任何类型的可视化文件,
无代码数据查询
共享适用于移动设备的交互式仪表板,
简单快捷的软件设置,
混合各种数据集。
卡桑德拉
Apache Cassandra是一个开放源代码的分布式类型数据库,旨在管理跨服务器分布的大量数据。它着重于结构化数据集。其服务可确保没有故障点。
这个大数据工具是免费的。
主要特点:
非常快速地处理大量数据,
线性可伸缩性
云可用性
没有单点故障,
自动复制,
在数据中心之间轻松进行数据分发。
Apache Spark
Apache Spark是一个开源工具,可处理实时数据和批处理数据。它启用了内存中数据处理,可确保更快的结果。这种大数据工具可以在单个本地系统上运行,从而使测试和开发更加轻松。
该工具基于Apache许可证。提供免费试用。
主要特点:
实现高流量操作
包括快速图形处理系统,
独立集群模式
在同一应用程序中合并的库堆栈,
DataFrame API,
部署到云环境。
Flink
Apache Flink是大数据流处理的开源框架。它可以是有界的和无界的。Flink可以在所有已知的群集环境中运行。它能够以内存速度任意规模地执行任务。
主要特点:
准确的结果(也适用于乱序或迟到的数据),
容错并从故障中恢复,
支持用于数据源的第三方系统的各种连接器,
启用灵活的窗口,
在数千个节点上运行。
扫描二维码免费领取试听课程
登录51乐学网
注册51乐学网