北京培训网 > 北京数据库工程师培训机构 > 北京优就业培训中心
首页 培训网 最新资讯 热门问答

北京优就业培训中心

15830143330 免费试听

您当前的位置: 北京软件系统培训 > 北京数据库工程师培训 > 北京好的大数据开发培训在哪

北京好的大数据开发培训在哪

¥详询

班制:其它

北京优就业培训教育中心
上课(咨询)地址:北京海淀区
报名咨询 预约试听
课程介绍

为什么你要学习大数据

大数据作为中国官方重点扶持的战略性新兴产业,已逐步从概念走向落地“大数据”和“虚拟化”两大热门领域,得到了广泛关注和重视。90%企业都在使用大数据,大数据开发人员的薪资待遇也水涨船高。统计数据显示,大数据开发工程师的就业薪资在5000-27000之间,有工作经验者更高。你选择了大数据就意味着高薪和广阔的未来。

千锋大数据开发靠什么引领群雄?

很多人想要站在大数据时代的风口却无从下手,千锋作为中国IT职业教育的领 先品牌顺势而为重磅推出大数据课程,采用“技术+管理”集合的方式,让你快速掌握大数据生态体系的各个模块的功能和开发技术,成为当下企业紧缺的“复合型”研发人才。

大数据相关技术方向

1. Hadoop大数据开发方向;

2. 大数据运维& 云计算方向;

3. 数据挖掘、数据分析&机器学**方向。

三个方向中,大数据开发是基础。以Hadoop开发工程师为例,Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万—50万,一般需要大数据处理的公司基本上都是大公司,所以学**大数据专业也是进大公司的捷径!

精通任何方向之一者,均会“ 前(钱)”途无量。

大数据相关的技术有:Hadoop、Linux、Oracle、 Jquery、 Spark、 Storm、Servlet、Python、Nginx、Memcached、Matlab、Scala、Maven等。

课程介绍

Storm实时开发
01storm简介与基本知识
- storm的诞生诞生与成长
- storm的优势与应用
- storm基本知识概念和配置
- 序列化与容错机制
- 可靠性机制—**消息处理
- storm开发环境与生产环境
- storm拓扑的并行度
- storm命令行客户端
02拓扑详解与组件详解
- 流分组和拓扑运行
- 拓扑的常见模式
- 本地模式与stormsub的对比
- 使用非jvm语言操作storm
- hook 组件基本接口
- 基本抽象类
- 事务接口
- 组件之间的相互关系
03Hadoop分布式系统
- 认识HDFS及其HDFS架构
- Hadoop的RPC机制
- HDFS的HA机制
- HDFS的Federation机制
- Hadoop文件系统的访问
- JavaAPI接口与维护HDFS
- HDFS权限管理
04spout详解与bolt详解
- spout获取数据的方式
- 常用的spout
- 学习编写spout类
- bolt概述
- 可靠的与不可靠的bolt
- 复合流与复合anchoring
- 使用其他语言定义bolt
- 学习编写bolt类
05zookeeper详解
- zookeeper简介
- zookeeper的下*和部署
- zookeeper的配置与运行
- zookeeper的本地模式实例
- zookeeper的数据模型
- zookeeper命令行操作范例
- storm在zookeeper中的目录结构
06storm安装与集群搭建
- storm集群安装步骤与准备
- 本地模式storm配置命令
- 配置hosts文件 安装jdk
- zookeeper集群的搭建
- 部署节点
- storm集群的搭建
07storm-starter详解
- storm-starter项目概述
- 使用maven进行管理
- 在eclipse中运行
- 使用daemontools监控storm进程
- 使用monit监控storm
- 常用的集群操作命令
- drpctopologybuilder
- Hive的权限控制
08开源数据库HBase
- HBase的特点
- HBase访问接口
- HBase存储结构与格式
- HBase设计
- 关键算法和流程
- HBase安装
- HBase的Shell操作
- HBase客户端
09trident详解
- trident概述
- Trident API 实践
- Trident操作详解
- trident spout
- 文件系统分析
- acking框架的实现
- metric
02前端工程化与模块化应用
- 项目截图:
- 项目说明:
SinaSpider主要爬取新浪微博的个人信息、微博数据、关注和粉丝。环境、架构:
- 开发语言:
Python2.7
- 开发环境:
64位Windows7系统,4G内存,i7-3612QM处理器。
- 数据库:
MongoDB 3.2.0 (Python编辑器:Pycharm 5.0.4;MongoDB管理工具:MongoBooster 1.1.1)
- 主要使用 scrapy 爬虫框架。
- 下*中间件会从Cookie池和User-Agent池中随机抽取一个加入到spider中。
- start_requests 中根据用户ID启动四个Request,同时对个人信息、微博、关注和粉丝进行爬取。
- 将新爬下来的关注和粉丝ID加入到待爬队列(先去重)。

机器学习&&深度学习
课程名称 重点内容 目标
一、R语言&&机器学习
1) R语言介绍,基本函数,数据类型
2) 线性回归
3) 朴素贝叶斯聚类
4) 决策树分类
5) k均值聚类

a) 离群点检测

6) 关联规则探索
7) 神经网络
R本身是一款十分优秀的数据分析和数据可视化软件,同时作为第1代机器学习的工具,其中包括大量用于机器学习的添加包。此部分带领大家学习R语言更是带领大家进入机器学习的领域,机器学习算法为主线的同时,经过案例学习将会让大家对内容脉络掌握的更加清晰。
二、Mahout机器学习
1) 介绍为什么使用它,它的前景

a) 简单介绍Mahout

b) 简单介绍机器学习

c) 实例演示Mahout单机推荐程序

2) 配置安装(hadoop2.x版本的)编译安装步骤说明

a) 命令行中测试运行协同过滤概念

3) 推荐

a) 讲解基于用户的协同过滤

b) 讲解基于物品的协同过滤

4) 分类

a) 分类概念

b) 分类的应用及Mahout分类优势

c) 分类和聚类、推荐的区别

d) 分类工作原理

e) 分类中概念术语

f) 分类项目工作流

g) 如何定义预测变量

h) 线性分类器的介绍,及贝叶斯分类器

i) 决策树分类器的介绍,及随机森林分类器

j) 如何使用贝叶斯分类器和随机森林分类器的代码展示

5) 聚类

a) 聚类概念

b) 聚类步骤流程

c) 聚类中的距离测度

d) 讲解K-means聚类

e) K-means聚类算法展示

f) 聚类其他算法

g) 介绍TF-IDF

h) 归一化

i) 微博聚类案例

Mahout提供一些可扩展的机器学习领域经典算法的实现,很多公司会使用Mahout方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。Mahout经过使用 Apache Hadoop,可以有效地扩展到云中。被业界奉为第二代机器学习工具。此部分过后大家不仅会学习到mahout的组件而且会有项目让大家真正把它应用到工作中。
三、项目实战
项目技术架构体系:

a) 分布式平台 Hadoop,MapReduce

b) 数据采集 Flume

c) 数据清洗 ETL

d) 数据库 Hbase,Redis

e) 机器学习 Mahout

微博营销数据挖掘项目使用数据来自微博平台,项目目标经过机器学习所学知识挖掘目标客户群体,找到代言人进行微博营销广告投放。


大数据12_wx.jpg

千锋互联


欢迎点击访问:北京大数据开发课程汇总

欢迎您访问到我们网站如果想了解更多北京软件系统类别课程请访问:北京软件系统课程汇总

课程定制与咨询:010-64707530 QQ:264567689  金老师

体验课预约试听

倒计时

12:00:00

课程热线:

15830143330
在线咨询

客服在线时间:早上9点~下午6点,其他时间请在线预约报名或留言,谢谢!

北京数据库工程师

免费体验课开班倒计时

11: 41: 09

稍后会有专业老师给您回电,请保持电话畅通

咨询电话:15830143330
推荐机构 全国分站 更多课程

本周仅剩 个试听名额

请键入信息,稍后系统将会把领奖短信发至您的手机

申请试听名额

已有10254人申请免费试听

01电话咨询 | 15830143330

QQ:2872347183
加盟合作:0755-83654572