Quantcast
Channel: piaoyu zhang的博客 » piaoyu
Browsing all 3 articles
Browse latest View live

Hadoop日志解析方案的探究

随着公司的Hadoop版本升级,之前的Hadoop日志解析也要进行升级。 Hadoop 2.0中作业日志收集原 [...]

View Article


Shark执行流程分析

Shark是基于Spark的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询 [...]

View Article


SparkR初探

一、  R大数据支持引擎的对比 R的并行能力和对大数据的支持能力一直备受诟病,虽然R可以高效的进行数据处理和机 [...]

View Article
Browsing all 3 articles
Browse latest View live