并行计算A(孙经纬) 2025春  课程号:CS402501
2025春  课程号:CS402501
10.0(2人评价)
  • 课程难度:中等
  • 作业多少:中等
  • 给分好坏:超好
  • 收获大小:很多
选课类别:计划内与自由选修 教学类型:理论实验课
课程类别:本科计划内课程 开课单位:计算机科学与技术系
课程层次:专业选修   学分:2.5
课程主页:暂无(如果你知道,劳烦告诉我们!)
简介 最后更新:

本课程简要讨论并行计算的硬件基础,即当代并行计算机的体系结构模型;着重讨论并行计算的核心内容,即并行算法的设计和典型常用的并行数值算法;以及并行计算的软件支持,即并行程序设计的原理和主要的编程方法。这些内容强调将并行计算机体系结构、并行算法设计和并行编程融为一体,注重讨论并行计算的基本原理与方法,体现出应用问题对并行编程的需要,并力图反映本学科的最新成就与学科发展前沿。

排序 学期

评分 评分 2条点评

Celesy 2025春
  • 课程难度:困难
  • 作业多少:很少
  • 给分好坏:超好
  • 收获大小:很多
  • 难度:困难
  • 作业:很少
  • 给分:超好
  • 收获:很多

2025.7.23

给分很好的一门课(

在期末确实考得不好的情况下也拿了4


考试当晚

先占坑并写一个回忆版题目:

  1. 阅读一个关于El Capitan超算的材料,回答问题
    1. El Capitan的架构
    2. 跑LINPACK后得到的是Rmax or Rpeak
    3. LINPACK里面多是稠密线性方程计算,限制是什么?列两点。
    4. 应该是有d的,不过忘了
  2. 伪代码描述一个并行的,O(n)工作量,求最大值的并行算法,并给出p(n)。
  3. 加速比
    1. 计算在Amdahl下的加速比
    2. 计算在Gustafson下的加速比
    3. 考虑Sun-Ni,并且并行化额外开销是We(p),求线性加速比要满足的条件
  4. 将处理器组织成立方体,求SF下:
    1. 从最角落(0,0,0)一到多播送的时间开销。
    2. N为奇数,求最中间($\lfloor N \rfloor, \lfloor N \rfloor, \lfloor N \rfloor$)开始的一到多播送时间开销。
  5. 矩阵乘法相关问题
    1. 给出朴素并行矩阵乘法在二维环绕网孔上的时间开销分析
    2. 给出FOX矩阵乘法在二维环绕网孔上的时间开销分析,并说明它优化了什么
    3. 已知现在的串行矩阵乘法可以达到O(n^c) ( $2 \le c \le 2.5$),FOX是成本最优吗
  6. MPI
    1. 多选,MPI_Recv可以对应哪些发送方式
    2. 多选,MPI_Irecv可以对应哪些发送方式
    3. 更改一个MPI片段,支持双缓冲轮流切换。( Slides原题,但我不会(( )
  7. 一个OpenMP计算素数个数和最大素数的程序片段
    1. 给出三个并行域里潜在的性能问题。
    2. 优化它们,给出新的main函数。
  8. 一个使用Shared_memory计算矩阵乘法的cuda Kernel。
    1. 填空计算部分
    2. 什么是Bank Conflict,怎么避免?
    3. 正确填空后,该Kernel可能遇到Bank Conflict吗?

 


总体而言是一个能学到很多东西的课程,实验是按运行时间评分的(事实上等笔者考完数据库还得来继续优化代码),要和助教的版本比较性能,期末难度还算高(吗?)。

还没给分,所以给分好坏暂时先写一般。

(最后修改于 0 1 复制链接
emo_小垃圾学长有没有课程群或者课程资料什么的,求求🥺🥺
立即登录,说说你的看法

其他老师的「并行计算A」课

孙经纬老师的其他课

并行计算 7.8 (12) 2024春