HDP tutorial

Jump to bottom Edit New page

王伟兵 edited this page Oct 25, 2017 · 3 revisions

从hortonworks.com首页下列菜单中进入，URL: https://hortonworks.com/tutorials/

HDP教程含有一系列文档，这些文档按以下维度进行了标签化：

级别：分高、中、低三级
角色：数据科学家或分析师、管理员、开发者
应用场景：流程管理、数据流、单视图、数据发现、数据仓库优化、预测、安全
技术：按hadoop的各个服务
环境：沙箱、HDClud

在环境维度选中Sandbox(沙箱)，发现HDP的沙箱教程共有43个。但由于是多维度分类，多个教程重复出现，实际教程数量大约30个。

开发

Apache Hive

HDP快速开始
Files View、Hive View 2.0、Pig View、Zeppelin
如何用Apache Hive处理数据
Files View、Hive View 2.0
用Hadoop加载和查询数据
Hive View 2.0
使用Hive ACID事务插入，更新和删除数据
基于Hive LLAP的Hadoop交互式SQL
基于Tez和Hive的Hadoop交互式查询

Apache Spark

Apache Spark的5分钟教程
单词计数和SparkR REPL(交互式解释器)例子
spark shell
Spark REPL(交互式解释器)的DataFrame和Dataset例子
spark shell
Apache Zeppelin入门
用Zeppelin学习Spark SQL
Spark SQL Thrift Server示例
beeline
使用Hive与ORC在Apache Spark REPL
Spark on YARN示例
用Python设置Spark开发环境
使用Scala建立Spark开发环境
使用Java设置Spark开发环境
使用Apache Spark和Apache Zeppelin介绍机器学习
使用SparkR预测航空公司延期
Spark Streaming介绍
使用Spark Structured Streaming部署机器学习模型
使用Apache Spark的情绪分析

现实世界的例子

通过Apache NiFi和HDP搜索分析社交媒体和客户情绪
可视化网站点击数据

Hello World

学习Hortonworks沙盒
Hadoop教程 - HDP入门
如何使用Apache Hive处理数据（重复）
如何使用Apache Pig处理数据（重复）
基于Tez和Hive的Hadoop交互式查询（重复）
基于Hive LLAP的Hadoop交互式SQL （重复）
使用Hadoop加载和查询数据（重复）
使用Hive ACID事务插入，更新和删除数据 (重复)

数据科学家和分析师

现实世界的例子

通过Apache NiFi和HDP搜索分析社交媒体和客户情绪（重复）
可视化网站点击数据

数据分析简介

Apache Pig的初学者指南
如何使用Apache Hive处理数据（重复）
如何使用Apache Pig处理数据
基于Tez和Hive的Hadoop交互式查询 (重复)
使用SparkR预测航空公司延误

hadoop管理

Hortonworks沙箱

沙箱部署和安装指南
Hortonworks Sandbox指南
沙盒端口转发指南

安全

基于Apache Ranger和Apache Atlas的基于标签的策略