O'Reilly、Cloudera 主办
Make Data Work
2016年8月3-4日:培训
2016年8月4-6日:会议
北京,中国
 
报告厅(Auditorium)
09:00 Apache Spark高级机器学习实践 王奕恒 (Intel), 邱鑫 (Intel), Zhichao Li (Intel)
13:30 深度学习的TensorFlow实现 Jianmin Chen (Google), 陈智峰 (Zhifeng Chen) (Google)
多功能厅2(Function Room 2)
09:00 Apache HBase开发者教程 杜竟成 (Jingcheng Du) (Intel), Wei Zhou (Intel)
13:30 Apache Kylin 教学辅导课 史少锋 (Kyligence)
多功能厅5B+C(Function Room 5B+C)
09:00 商业应用中的数据科学和机器学习 Angie Ma (Faculty), Yingsong Zhang (ASI Data Science)
13:30 内存为中心的开源虚拟分布式存储系统Alluxio(前Tachyon)入门 Haoyuan Li (Alluxio), Bin Fan (Alluxio), Yupeng Fu (Alluxio), 顾荣
多功能厅8(Function Room 8)
09:00 Spark camp: Exploring big data with Apache Spark Sameer Farooqui (Databricks)
08:00 上午茶服务 | Room: 1楼序厅(1st Floor Foyer)
10:30 上午茶歇 | Room: 1楼序厅(1st Floor Foyer)
15:00 下午茶歇 | Room: 1楼序厅(1st Floor Foyer)
12:30 午餐 | Room: 彩虹厅 (Rainbow Room)
09:00-12:30 (3h 30m) Spark及更多新发展 机器学习
Apache Spark高级机器学习实践
王奕恒 (Intel), 邱鑫 (Intel), Zhichao Li (Intel)
在大数据时代,越来越多的企业引入了机器学习技术以提高效率和降低风险。而进行大数据的机器学习是一件比较具有挑战性的工作。作为最流行的大数据处理平台,Apache Spark提供了丰富的机器学习组件,帮助开发者大大降低了这项工作的复杂性。Intel帮助大型互联网和企业用户在Spark平台上做了大量机器学习的实现和优化工作。在本次课程中,来自Intel的工程师会带领大家探索Spark上的机器学习组件以及一些高级功能,并分享真实案例中的实践经验。
13:30-17:00 (3h 30m) 数据科学与高级分析 人工智能, 机器学习
深度学习的TensorFlow实现
Jianmin Chen (Google), 陈智峰 (Zhifeng Chen) (Google)
陈健敏和陈智峰示范使用TensorFlow这个广受欢迎的开源库训练和部署机器学习系统。你将能学会如何创建一个机器学习系统,小到简单的分类器,大到复杂的基于图像的模型,还可以学会如何使用TensorFlow Serving来部署你的模型。
09:00-12:30 (3h 30m)
Apache HBase开发者教程
杜竟成 (Jingcheng Du) (Intel), Wei Zhou (Intel)
Apache HBase, Apache Hadoop生态系统中的分布式数据库,是当今最流行的非关系型数据库之一,也被许多世界级的公司所使用,如阿里巴巴,小米,Facebook和Apple,用来存储和分析PB级的数据。 竟成和伟将为您讲述HBase的架构,并详解如何使用HBase提供实时的大数据服务。
13:30-17:00 (3h 30m) 企业应用
Apache Kylin 教学辅导课
史少锋 (Kyligence)
Kyligence由Apache顶级项目Apache Kylin核心贡献者团队组建,团队一贯致力于推动Apache Kylin开源项目的发展和演进,提供基于的Apache Kylin的大数据分析产品和服务,拓展全球用户社区,构建更为丰富的生态系统。 Apache Kylin Tutorial针对Apache Kylin的使用者,管理者及开发者提供相关的辅导课程,由Apache Kylin 核心贡献者及PMC 成员倾力提供,学员经认证考试,可获得由Kyligence公司提供的相关认证证书。
09:00-12:30 (3h 30m) 数据科学与高级分析 机器学习
商业应用中的数据科学和机器学习
Angie Ma (Faculty), Yingsong Zhang (ASI Data Science)
这个3小时的辅导课从业务的角度出发集中介绍了数据科学的关键概念。本课程是为了那些希望在他们业务中引入数据科学的听众所准备的。
13:30-17:00 (3h 30m) 数据创新
内存为中心的开源虚拟分布式存储系统Alluxio(前Tachyon)入门
Haoyuan Li (Alluxio), Bin Fan (Alluxio), Yupeng Fu (Alluxio), 顾荣
本辅导课内容为了解Alluxio(前Tachyon)的基本原理, 应用场景, 以及如何使用Alluxio让分布式计算引擎以内存速度共享以及交换数据. 在上机实践环节中, 参与者将在老师指导下亲自动手部署和运行Alluxio, 为Alluxio挂载外部存储系统(如HDFS), 使用Alluxio内置命令行与系统交互, 并尝试使用常见计算引擎(如Apache Spark)搭建从Alluxio系统中读写的大数据应用. 此外学员还将学习Alluxio内置的常用命令行操作, Web界面使用操作, 使用面向开发者的API. 本辅导课理想参加者群体包括(但不限于)大数据应用开发人员, ETL开发人员, 数据科学家,存储管理人员。
09:00-17:00 (8h)
Spark camp: Exploring big data with Apache Spark
Sameer Farooqui (Databricks)
The real power and value proposition of Apache Spark is in building a unified use case that combines ETL, batch analytics, real-time stream analysis, machine learning, graph processing, and visualizations. Through hands-on examples, Sameer Farooqui and Andrew Orr explore various Wikipedia datasets to illustrate a variety of ideal programming paradigms.
08:00-09:00 (1h)
上午茶服务
10:30-11:00 (30m)
上午茶歇
15:00-15:30 (30m)
下午茶歇
12:30-13:30 (1h)
午餐

联系OReillyData

关注OReillyData微信号获取最新会议信息并浏览前沿数据文章。

WeChat QRcode

来自全球Strata+Hadoop 会议的照片。

Stay Connected Image 1

北京

Stay Connected Image 3

新加坡

Stay Connected Image 2

伦敦

阅读关于大数据的最新理念。

ORB Data Site