主要看的讲师幻灯片 http://strata.oreilly.com.cn/hadoop-big-data-cn/public/schedule/proceedings Alluxio(Tachyon) 依然是亮眼的新秀,大概由于是国人主导开发的,在国内接受度越来越高了。从去年开始
看起来变化还比较大,之前对 rdd 进行 cache(StorageLevel.OFF_HEAP) 操作是存到 tachyon 里面的,现在直接移除了,用了自己的一套实现,tachy
Spark 可以和 Tachyon 配合使用,使用内存作为数据存储介质,可以有效提高大数据计算时的吞吐量,目前 Tachyon 的版本迭代较快
14年11月份 Hadoop 社区发布了最新版本 2.6.0,打算在这个基础上跑 Spark+Tachyon,需要对 Spark