大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)
注意: 本项目已经不再维护
- Elastic Search 操作
- Hive操作
- Hbase操作
- Hadoop操作
- Spark操作
- yarn
- zookeeper
- Linux Shell
- 其他
- dmp项目架构设计
- 数据挖掘
- 中文分词
- 网络爬虫
- 数据分析
- 通用模块
- 数据清洗
- 数据标签
- 业务分析
- 数据导入
- 数据分析
- 算法应用
###dmp工程
- es介绍 es 为ElasticsearchES官网是一个基于Apache Lucene(TM)的开源搜索引擎。 无论在开源还是专有领域,Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。在dmp工程项目中一般用于企业级搜索方案的构建,其本身强大的搜索引擎功能和分布式功能可以快速准确的进行大量数据的快速搜索。 在本代码库中采用Java ES接口,当前代码有cluster、client、Node管理、CRUD操作、Search操作等