跳至主要内容

数据密集型计算导论

选课已关闭

课程简介

现代科学研究往往要对大量的数据进行分析,如何帮助科学家有效地管理这些数据,并在分布式计算环境的支撑下方便地完成数据处理,发现新的模式和科学知识是当前密集型科学计算的关键问题。

通过学习密集型科学计算的基础知识、原理和技术,将使学生了解这一领域的国际研究前沿,加深对分布式系统和云计算的理解和掌握。

先修要求

高级程序语言设计 数据结构与算法 计算机系统结构

教师团队

Course Staff Image #1

吴文峻

从事分布式系统方面的研究工作,主讲数据密集型计算导论。

FAQ

从这门课程学到什么?

通过本课程的学习,学生应该了解数据密集型计算的基本概念,并行文件系统和分布式存储系统的组织方式和基本技术,熟悉Map-Reduce的编程模型、Hadoop和HDFS文件系统,了解科学工作流系统的主流技术和在典型科学数据分析领域的应用

有哪些教学参考书?

1.网格计算核心技术,Maozhen Li, Mark Baker, 清华大学出版社

2.The Fourth Paradigm: Data-Intensive Scientific Discovery,Tony Hey, Stewart Tansley, Kristin Tolle, Microsoft Research

3.Scientific Data Management: Challenges, Technology, and Deployment,Arie Shoshani, Doron Rotem, Chapman and Hall/CRC

  1. 课程代码

    M_F06D3770
  2. 课程开始

    2015/03/01
  3. 课程结束

    2015/06/18
  4. 总计选修人数

    2
360网站安全检测平台