大数据课程-hadoop课程,spark课程,Python课程,java课程,尚是科技专注于大数据_西安尚是网络科技有限公司

029-89565337

当前位置:

首页 > 课程

 

 

javaSE和linux操作系统
操作系统 大数据简介 大数据的价值
大数据的发展史
Linux 操作系统基础 Linux介绍
Linux 操作系统概述
为什么 Linux 操作系统是大数据的最佳选择
各个发行版 Linux 的对比(Debian/Ubuntu/CentOS)
VMware介绍及安装
安装Linux
实践:配置 Linux 操作系统环境变量
Linux 操作系统时间管理
Linux 操作系统的时区
NTP 网络时间协议介绍
实践: 配置 NTP 时间服务器
Linux 软件包管理与 RPM 软件包格式
实践:配置 yum 网络与本地源
Linux常用系统命令
Linux常用文件系统命令
规定边框的样式。
规定边框的宽度。
规定应该从父元素继承 outline 属性的设置。
JAVA基础 JAVA开发环境配置 JDK的安装、环境变量配置、JDK的目录结构等
JAVA编程基础 Java的标识符、常量与变量、运算符、选择结构语句、循环结构语句、方法的定义与重载、数组的定义与使用等
面向对象上 面向对象特征、类和对象、类的封装、构造方法的定义与重载、this关键字、static关键字、内部类等
面向对象下 类的继承、final关键字、抽象类和接口、多态、异常、包机制等内容
线程 线程的创建、线程的生命周期、线程的调度、线程的同步、线程的通信
JAVA常用API String类和StringBuffer类、System类和Runtime类、Math类和Random类、包装类、日期类等内容的讲解
集合框架 List接口、Set接口、Map接口、泛型、Collections工具类、Arrays工具类等内容
网络编程 TCP/IP协议、IP地址和端口号、InetAdderss、对象的使用、UDP和TCP通信
swing swing简介,JtextField,JButton等的使用,至少三种布局的使用,插件window的使用
JAVA高级 反射 反射机制概述、常用类
泛型 泛型概述、实现、泛型类、泛型接口
序列化 序列化和反序列化的概述和实现

java高级javaEE
MySql数据库 MySql的安装和简介 安装配置、注意事项、简介
数据库和SQL 数据库和sql的介绍
SQL简介和数据库的简单操作 创建表、修改表名 、修改字段名、 添加字段、 删除字段、删除约束 、删除表
数据类型 BLOB类型 、整型 、日期和时间类型 、TIME类型 、YEAR类型 、CHAR和VARCHAR类型 、BINARY和VARBINARY类型 BLOB和TEXT类型 、ENUM类型
运算符 逻辑运算符、算术运算符、比较运算符
查询 基本语法 、建立测试表 、带like的字符匹配查询 、查询空值 、AND、OR、DISTINCT关键字 、Limit关键字
索引 索引的分类 、普通索引 、唯一索引 、创建复合索引 、全文索引 、概述、删除索引
SQL的基础查询聚合查询和排序 SQL的简单查询,select、min、max、sum、avg、count、order by 排序、where
事务约束数据库范式,SQL函数 数据库的三大范式,以及一些SQL的简单函数的应用
视图 视图的创建、删除、变更、操作的注意点
SQL的复杂查询 联结查询,交叉查询,等值查询,子查询,标量子查询、关联子查询
mysql的函数和存储过程 mysql的函数、自定义函数、存储过程
mysql的备份和还原 mysql中的文件和数据库的备份和还原
Oracle数据库 oracle的安装和配置 数据库的安装配置,注意事项
oracle组件 系统全局区、程序全局区、后台进程的介绍、物理结构和逻辑结构
oracle的用户管理 oracle中的一些默认用户、创建用户、给予用户赋权限、用户的管理
视图和同义词 同义词的定义、公共同义词、视图、视图的操作、联结视图
oracle的约束 主键约束、非空约束、唯一约束、主外键约束、检查约束
索引 唯一索引、组合索引、反向键索引、位图索引
sql简介和数据类型 数据的类型:字符类型、数值类型、日期时间类型、二进制类型
sql中的语言及其分类 数据定义语言、数据控制语言、事务控制语言、什么是事务、事务的ACID特性
操作符 算术操作符、逻辑操作符、比较操作符、集合操作符、连接操作符、操作符优先级
函数 日期函数、字符函数、数字函数、转换函数、分组函数、分析函数
oracle中的锁 锁的概念、行级锁、表级锁、死锁
序列 序列、表分区、表分区的类型、分区的维护
plsql 变量、常量、数据类型、流程控制、错误处理
游标 隐式游标、显式游标、循环游标、ref游标、游标变量
子程序和程序包 子程序、过程、函数、程序包、程序包中的游标
触发器 创建触发器、触发器类型、启动禁用删除触发器、查看触发器
内置程序包 内置程序包以及简单的介绍
备份和恢复 导出、导入、闪回操作
JavaWeb HTML html概述、html整体结构、html的元素(标签)和属性概述、html的常用标签(元素)、html的表单元素、html注释和实体标识
CSS css简介、css的语法、css属性和属性值、css的引入方式、css的选择器、css属性用法
JavaScript js概述、js词法结构、基本数据类型和变量、js其它数据类型、js的运算符、 js语句、Window对象、Dom对象、Ajax
jQuery jQuery简介、jQuery选择器、jQuery操作样式、jQuery事件、 jQuery效果、 jQuery操作页面元素
RegularExpressions正则表达式 关键标识匹配、范围匹配、边界匹配、matches find lookingAt、start end、group分组、字符替换
Tomcat的应用 Web应用简介、Web应用架构之B/S、B/S架构运行特点、java应用服务器简介、tomcat服务器简介、Eclipse配置
Servlet 什么是servlet、Servlet的功能、servlet生命周期、servlet运行流程、servlet的创建流程、web.xml配置信息详解、注解
request(请求)和response(响应) HttpServletRequest请求、方法、HttpServletResponse请求、方法、请求和重定向的区别
JavaBean 什么是JavaBean、javabean属性私有化的原因
session会话技术 Cookie的常用方法、关于cookie的禁用、cookie使用与生命周期、什么是session、session的基本方法、session过期的必要性、什么是application、application和session的区别
JSP jsp指令元素、jsp动作元素、jsp脚本元素、jsp内置对象
EL表达式/JSTL/自定义标签 EL表达式/JSTL/自定义标签
junit单元测试 什么是junit、junit的优点、设置步骤、预言判断的使用
Filter(过滤器)和listener(监听器) 监听器和过滤器的创建,使用简介,常见的一些应用
DAO设计模式 什么是Dao设计模式、Dao设计模式的结构
MVC模式 MVC模式的产生、应用、项目中MVC的示例
JSON JSON语法、对象、数组、文本转换
Spring Spring的基本应用 Spring的概述、Spring的IOC容器、Spring程序例子、依赖注入
Spring中的Bean Bean的配置、生命周期、作用域、xml装配方式、自动装配
面向切面编程AOP SpringAOP介绍、手动代理等内容
Spring数据库开发 Spring数据库配置、JDBCTemplate的常用方法和解析
Spring事务管理 Spring事务管理的3个核心接口
TransactionProxyFactoryBean
Spring AOP XML方式
Spring AOP Annotation方式
SpringMVC SpringMVC入门 SpringMVC简介,示例以及MVC的设计思想
SpringMVC的参数传递 简单类型的传递,多个类型的传递,类对象得 参数传递,json的传递,
以及SpringMVC对于Servlet的API支持,转发和重定向
SpringMVC的REST风格 SpringMVC对于REST风格的支持,@PathVariable获取URL变量,SpringMVC对于静态资源的处理
SpringMVC的上传 SpringMVC单文件上传,SpringMVC多文件上传
MyBatis MyBatis概述 MyBatis与传统JDBC的比较,MyBatis的概念,MyBatis的优点
MyBatis环境配置 MyBatis开发步骤、jar包相关、系统核心配置文件、mapper映射文件
MyBatis核心对象 MyBatis三大核心对象、SqlSession的获取和使用、SqlSession调用sql方法的方式
crud方法的映射器配置 增删改查的写法
级联查询 一对一和一对多级联查询的写法
MyBatis延迟加载 使用association实现延迟加载的方法、延迟加载的配置
MyBatis动态SQL 动态SQL概述、分类,各动态元素

hadoop生态
离线数据的分析和处理 hadoop的搭建 jdk安装及配置
Hadoop 集群的规划与搭建
部署 Hadoop 集群之前要考虑的几件事
集群节点的硬件选择
集群节点的软件选择
规划一个可扩展的集群
Hadoop 分布式文件系统:HDFS 概述
hdfs hdfs出现背景
hdfs存储原理
hdfs基本架构
hdfs读写文件流程
hdfs元数据更新流程
部署hdfs前置条件
hdfs配置详解
hdfs部署及初始化
hdfs基本使用命令
hdfs维护命令
yarn yarn出现背景
yarn基本原理
yarn基本架构
yarnjob执行流程
yarn资源管理流程
部署yarn
yarn配置详解
yarn常用命令
yarn维护命令
mapreduce Hadoop 分布式计算框架 - MapReduce 概述
MapReduce 起源
mapreduce简介
mapreduce基本原理(WordCount)
实践:执行一个 MapReduce 程序
本是同根生:YARN 与 MapReduce
Hadoop 分布式计算框架 - MapReduce 进阶
MapReduce 关键过程:Partitioner
实践:实现自定义 Partitioner
MapReduce 关键过程:Shuffle 和 Sort
MapReduce 的缺陷与分布式缓存 Distribute Cache
实践:动手写你的第一个MapReduce 程序,利用它分析 HDFS 上的文件
hadoop集群的高可用(zookeeper) Hadoop 集群的高级配置
高级配置参数详解
实践:在集群中查找参数并修改参数的默认值
配置 Hadoop HDFS 高可用环境 HA
资源协调器:Apache Zookeeper 组件介绍
Zookeeper 选举算法:Paxos算法
Hadoop 性能调优
HDFS 组件性能调优:数据平衡
实践:HDFS 数据节点的数据平衡
YARN / MapReduce 组件性能调优
实践:MapReduce 内存选项调整
#实践:一次集群故障的诊断
hive hive出现背景
hive基本原理
hive基本架构
hive配置详解
查询数据与分析:Hive
Apache Hive 介绍
Hive 与 HDFS 的关系
Hive 的表结构与数据存储
对比 Hive 与传统关系型数据库
实践:Hive 的安装与部署
Hive 基本数据分析:Hive 数据库和表
基本 HiveQL 语法
数据类型和内建功能
数据查询与分析:Hive 进阶
Hive 的数据格式
Hive 查询简化:视图
实践:Hive 数据管理
Hive 的文本处理
hive连接jdbc
实践:通过数据的情绪分析获取价值
Hive 优化与扩展
理解 Hive 查询性能
控制 Hive 任务语句执行计划
Hive 表分区,分桶
SerDes,UDF 以及并行查询
实践:Hive 的数据类型转换
图像化软件hue的安装与使用
hbase 分布式数据库的发展历史
hbase出现背景
hbase基本原理
hbase基本架构
hbase split流程
hbase compact流程
hbase配置详解
hbase部署及启动
hbase常用命令
hbase表设计
分布式数据库的数据模型
分布式数据库的分类
与传统关系型数据库的关系
NoSQL 数据库的分类和产品介绍
hadf与hbase的分别适用于哪些场景
HBase 基础
HBase的优势与劣势
HBase 表的基础知识
表的设计热点问题,以及解决
hbase过滤器
hbase之mapreduce
HBase Shell
利用 HBase Shell 创建表
表的基本操作
操作表中的数据
HBase 体系结构
l HBase Regions
l HBase 集群体系结构
l HBase 和 HDFS 的数据本地化
集群中的 HBase
HBase 与 HDFS
数据合并和拆分
HBase 读 & 写
HBase 写入数据流程
HBase 读取数据流程
数据读取时的数据块缓存
HBase 性能优化
设计 Column Family 的注意事项
设计 Schema 的注意事项
配置缓存
处理时间序列数据和序列数据
Regions 的预拆分
HBase 的管理和集群操作
HBase 后台进程
ZooKeeper 注意事项
HBase 的高可用
操作工具操作工具phoenix的安装与使用
实践:基于hbase的仿微信应用

spark生态
流式数据实时处理
flume kafka 了解 Flume 组件
实践:Flume 组件的高级功能:自定义 agent
Apache kafka 组件介绍
流动的数据
实时数据分析概述
实时数据抽取与预处理:Flume、Kafka
深入了解 Flume 拦截器
实践:Flume 自定义拦截器与 Avro 对象
Kafka 介绍
Message,Topic 和 Partitions 的概念
Producers 和 Consumers
消息顺序保证
与 Flume 组件的集成
利用 Mapreduce 对静态数据数据 (HDFS) 添加索引
利用 Flume 对数据进行实时索引
sqoop安装与使用
sqoop在关系型数据库和数据库之间的迁移
增量导入
实践:部署 kafka 组件的注意事项
流式数据实时处理 storm storm概念和安装
storm架构和原理
storm可靠性
storm程序任务提交
storm整合redis
storm整合kafka
storm整合hbase
scala语言 scala简介、scala安装
scala变量、运算符、修饰符
scala定义方法、类、包
scala数组,元组,集合高级方法
scala面向对象
scala函数,高阶函数
scala练习
spark spark简介以及安装
spark基本架构
spark on yarn部署
spark 集群部署
spark sql介绍
spark streaming介绍
spark MLlib介绍
使用 Spark Shell
RDDs (弹性分布式数据集)
Spark 里的函数式编程
深入理解RDDs
创建 RDDs
RDD 的常用操作
键 - 值对类型的 Pair RDDs
Map-Reduce
其它 Pair RDD 操作
编写和部署 Spark 应用
Spark 应用程序 vs. Spark Shell
创建 SparkContext
构建 Spark 应用程序 (用 Scala 和 Java 语言)
运行一个 Spark 程序
Spark 应用的网页界面
动手练习: 编写并运行一个
Spark 应用程序
配置 Spark 属性
日志
并行处理
回顾:在集群中运行 Spark
RDD 分区
基于文件的 RDDs 分区
HDFS 和 数据本地化(Data Locality)
执行并行操作
Stages 和 Tasks 概念
Spark 的持久化
数据沿袭
数据持久化概念
分布式持久化
Spark 数据处理的通用模型
Spark 中的迭代算法
机器学习
RDD、DataFrame、Dataset
Spark 2.0 新特性
Spark SQL 和 SQL Context
创建 DataFrames
DataFrames 的转换和查询
保存 DataFrames
DataFrames 和 RDDs
Dataset 接口
Spark SQL,Impala 和 Hive-on-Spark 的对比
Spark Streaming 介绍
Spark 分布式内存结构 RDD
RDD 的流式表示结构:DStreams
Streaming state 操作
实践:利用 Spark steamming 实现实时词频统计
其它流式计算框架介绍

大数据高级
python python 解释型脚本初探
python开发环境
python的内置容器
并行开发
python的正则
socket编程基础
实现一个抓取代理服务器的小爬虫
django高级应用
twisted 实现网络应用服务器
机器学习 机器学习 机器学习简单了解
机器学习的理论基础
机器学习的发展历程
机器学习里的 3C
数据和算法的重要性
实践:朴素贝叶斯分类
机器学习进阶:推荐系统与决策系统概述
什么是推荐系统
协同过滤的分类
推荐系统的局限性
实践:推荐系统实例分析
什么是决策系统
协同过滤的类型
推荐系统的局限
实践:推荐系统实例分析
利用 Spark MLlib 基础
回顾 Spark 组件
Spark 最新版本 Spark 2.0 的数据引擎变化
Spark 机器学习库 MLlib
实践:Pagerank 算法实现
利用 Spark MLlib 进阶