Skip to content
王伟兵 edited this page Oct 25, 2017 · 3 revisions

从hortonworks.com首页下列菜单中进入,URL: https://hortonworks.com/tutorials/

HDP教程含有一系列文档,这些文档按以下维度进行了标签化:

  1. 级别:分高、中、低三级
  2. 角色:数据科学家或分析师、管理员、开发者
  3. 应用场景: 流程管理、数据流、单视图、数据发现、数据仓库优化、预测、安全
  4. 技术: 按hadoop的各个服务
  5. 环境: 沙箱、HDClud

环境维度选中Sandbox(沙箱),发现HDP的沙箱教程共有43个。但由于是多维度分类,多个教程重复出现,实际教程数量大约30个。

开发

Apache Hive

  1. HDP快速开始
    Files View、Hive View 2.0、Pig View、Zeppelin
  2. 如何用Apache Hive处理数据
    Files View、Hive View 2.0
  3. 用Hadoop加载和查询数据
    Hive View 2.0
  4. 使用Hive ACID事务插入,更新和删除数据
  5. 基于Hive LLAP的Hadoop交互式SQL
  6. 基于Tez和Hive的Hadoop交互式查询

Apache Spark

  1. Apache Spark的5分钟教程
  2. 单词计数和SparkR REPL(交互式解释器)例子
    spark shell
  3. Spark REPL(交互式解释器)的DataFrame和Dataset例子
    spark shell
  4. Apache Zeppelin入门
  5. 用Zeppelin学习Spark SQL
  6. Spark SQL Thrift Server示例
    beeline
  7. 使用Hive与ORC在Apache Spark REPL
  8. Spark on YARN示例
  9. 用Python设置Spark开发环境
  10. 使用Scala建立Spark开发环境
  11. 使用Java设置Spark开发环境
  12. 使用Apache Spark和Apache Zeppelin介绍机器学习
  13. 使用SparkR预测航空公司延期
  14. Spark Streaming介绍
  15. 使用Spark Structured Streaming部署机器学习模型
  16. 使用Apache Spark的情绪分析

现实世界的例子

  1. 通过Apache NiFi和HDP搜索分析社交媒体和客户情绪
  2. 可视化网站点击数据

Hello World

  1. 学习Hortonworks沙盒
  2. Hadoop教程 - HDP入门
  3. 如何使用Apache Hive处理数据 (重复)
  4. 如何使用Apache Pig处理数据 (重复)
  5. 基于Tez和Hive的Hadoop交互式查询 (重复)
  6. 基于Hive LLAP的Hadoop交互式SQL (重复)
  7. 使用Hadoop加载和查询数据 (重复)
  8. 使用Hive ACID事务插入,更新和删除数据 (重复)

数据科学家和分析师

现实世界的例子

  1. 通过Apache NiFi和HDP搜索分析社交媒体和客户情绪 (重复)
  2. 可视化网站点击数据

数据分析简介

  1. Apache Pig的初学者指南
  2. 如何使用Apache Hive处理数据 (重复)
  3. 如何使用Apache Pig处理数据
  4. 基于Tez和Hive的Hadoop交互式查询 (重复)
  5. 使用SparkR预测航空公司延误

hadoop管理

Hortonworks沙箱

  1. 沙箱部署和安装指南
  2. Hortonworks Sandbox指南
  3. 沙盒端口转发指南

安全

  1. 基于Apache Ranger和Apache Atlas的基于标签的策略
Clone this wiki locally