forked from boj/boj.github.com
-
Notifications
You must be signed in to change notification settings - Fork 30
HDP tutorial
王伟兵 edited this page Oct 25, 2017
·
3 revisions
从hortonworks.com首页下列菜单中进入,URL: https://hortonworks.com/tutorials/
HDP教程含有一系列文档,这些文档按以下维度进行了标签化:
- 级别:分高、中、低三级
- 角色:数据科学家或分析师、管理员、开发者
- 应用场景: 流程管理、数据流、单视图、数据发现、数据仓库优化、预测、安全
- 技术: 按hadoop的各个服务
- 环境: 沙箱、HDClud
在环境维度选中Sandbox(沙箱),发现HDP的沙箱教程共有43个。但由于是多维度分类,多个教程重复出现,实际教程数量大约30个。
- HDP快速开始
Files View、Hive View 2.0、Pig View、Zeppelin - 如何用Apache Hive处理数据
Files View、Hive View 2.0 - 用Hadoop加载和查询数据
Hive View 2.0 - 使用Hive ACID事务插入,更新和删除数据
- 基于Hive LLAP的Hadoop交互式SQL
- 基于Tez和Hive的Hadoop交互式查询
- Apache Spark的5分钟教程
- 单词计数和SparkR REPL(交互式解释器)例子
spark shell - Spark REPL(交互式解释器)的DataFrame和Dataset例子
spark shell - Apache Zeppelin入门
- 用Zeppelin学习Spark SQL
- Spark SQL Thrift Server示例
beeline - 使用Hive与ORC在Apache Spark REPL
- Spark on YARN示例
- 用Python设置Spark开发环境
- 使用Scala建立Spark开发环境
- 使用Java设置Spark开发环境
- 使用Apache Spark和Apache Zeppelin介绍机器学习
- 使用SparkR预测航空公司延期
- Spark Streaming介绍
- 使用Spark Structured Streaming部署机器学习模型
- 使用Apache Spark的情绪分析
- 通过Apache NiFi和HDP搜索分析社交媒体和客户情绪
- 可视化网站点击数据
- 学习Hortonworks沙盒
- Hadoop教程 - HDP入门
- 如何使用Apache Hive处理数据 (重复)
- 如何使用Apache Pig处理数据 (重复)
- 基于Tez和Hive的Hadoop交互式查询 (重复)
- 基于Hive LLAP的Hadoop交互式SQL (重复)
- 使用Hadoop加载和查询数据 (重复)
- 使用Hive ACID事务插入,更新和删除数据 (重复)
- 通过Apache NiFi和HDP搜索分析社交媒体和客户情绪 (重复)
- 可视化网站点击数据
- Apache Pig的初学者指南
- 如何使用Apache Hive处理数据 (重复)
- 如何使用Apache Pig处理数据
- 基于Tez和Hive的Hadoop交互式查询 (重复)
- 使用SparkR预测航空公司延误
- 沙箱部署和安装指南
- Hortonworks Sandbox指南
- 沙盒端口转发指南
- 基于Apache Ranger和Apache Atlas的基于标签的策略