Presented by O'Reilly and Cloudera
Make Data Work
July 12-13, 2017: Training
July 13-15, 2017: Tutorials & Conference
Beijing, China
Rong Gu

Rong Gu
助理研究员, 南京大学

网站

顾荣,博士毕业于南京大学计算机系,现就职于南大计算机系,大数据开源存储项目Alluxio PMC member and mainitainer,Apache Spark contributor。作为知名的Alluxio社区开发者,顾荣完成了Alluxio很多功能稳定和性能增强方面的工作,包括性能测试框架Alluxio-Perf、Alluxio与Hadoop生态系统多个组件的整合、开发社区中文文档等。在与Spark结合方面,顾荣还设计实现了Spark 1.0版本中发布的支持RDD 存储到Alluxio的功能。顾荣目前已经发表或录用论文十余篇(其中10篇第一作者),并且参与编写《深入理解大数据—卷1: 大数据处理与编程实践》、《实战Hadoop:开启通向云计算的捷径》等书籍中的部分章节。顾荣热衷于技术分享,是南京大数据技术Meetup的组织人(已举行7次活动),也多次在国内知名的技术大会(例如中国数据库技术大会)上进行技术演讲。此外,顾荣曾在Microsoft Research、Intel、Baidu、星环科技(Transwarp)从事过大数据系统研发实习工作。

议题

09:00–12:30 Thursday, 2017-07-13
数据工程和架构 (Data engineering and architecture)
Location: 多功能厅5C(Function Room 5C) 观众水平 (Level): 中级 (Intermediate)
Yupeng Fu (Alluxio), Rong Gu (南京大学)
在这个三个小时的教学课中, 我们将向参与者讲授Alluxio基础知识,演示Alluxio如何工作以及如何使用此系统帮助分布式计算引擎(如Spark或MapReduce)以内存速度共享数据。 Read more.
14:50–15:30 Saturday, 2017-07-15
Spark及更多发展 (Spark & beyond)
Location: 多功能厅2(Function Room 2) 观众水平 (Level): 中级 (Intermediate)
Rong Gu (南京大学)
Alluxio(原名Tachyon)是开源的、以内存为中心的统一分布式存储系统。它为上层计算框架和底层存储系统构建了桥梁。Alluxio还提供了分层存储机制,不仅可以管理内存,也可以统一管理SSD 和HDD等存储设备资源。为了使热数据尽量在更快的存储层上,我们在Alluxio中针对多种大数据的应用场景设计实现了众多高级的缓存替换策略包括LIRS、ARC、LRFU等。这些缓存策略已经被集成到Alluxio系统之中,并且可以很方便地用于上层应用性能调优。此外,为了对Alluxio上层的应用进行更大规模的性能评测和调优,我们还设计实现了针对的Alluxio大规模性能评测系统Alluxio-Perf。本演讲中,我将对针对Alluxio大数据的缓存策略与性能评测调优工具Alluxio-Perf的基本原理和使用方式进行详细的介绍。 Read more.

Connect with O'ReillyData

Use the QR Code to follow OReillyData and get the latest conference information and browse data articles.

WeChat QRcode

 

Stay Connected Image 1
Stay Connected Image 3
Stay Connected Image 2

Read the latest ideas on big data.

ORB Data Site