Skip to main content

数据密集型计算导论

Enrollment is Closed

课程简介

现代科学研究往往要对大量的数据进行分析,如何帮助科学家有效地管理这些数据,并在分布式计算环境的支撑下方便地完成数据处理,发现新的模式和科学知识是当前密集型科学计算的关键问题。

通过学习密集型科学计算的基础知识、原理和技术,将使学生了解这一领域的国际研究前沿,加深对分布式系统和云计算的理解和掌握。

先修要求

高级程序语言设计 数据结构与算法 计算机系统结构

教师团队

Course Staff Image #1

吴文峻

从事分布式系统方面的研究工作,主讲数据密集型计算导论。

FAQ

从这门课程学到什么?

通过本课程的学习,学生应该了解数据密集型计算的基本概念,并行文件系统和分布式存储系统的组织方式和基本技术,熟悉Map-Reduce的编程模型、Hadoop和HDFS文件系统,了解科学工作流系统的主流技术和在典型科学数据分析领域的应用

有哪些教学参考书?

1.网格计算核心技术,Maozhen Li, Mark Baker, 清华大学出版社

2.The Fourth Paradigm: Data-Intensive Scientific Discovery,Tony Hey, Stewart Tansley, Kristin Tolle, Microsoft Research

3.Scientific Data Management: Challenges, Technology, and Deployment,Arie Shoshani, Doron Rotem, Chapman and Hall/CRC

  1. Course Number

    M_F06D3770
  2. Classes Start

    Mar 01, 2015
  3. Classes End

    Jun 18, 2015
  4. Total Enrolled

    2
360网站安全检测平台