2025.7.23
给分很好的一门课(
在期末确实考得不好的情况下也拿了4
考试当晚
先占坑并写一个回忆版题目:
- 阅读一个关于El Capitan超算的材料,回答问题
- El Capitan的架构
- 跑LINPACK后得到的是Rmax or Rpeak
- LINPACK里面多是稠密线性方程计算,限制是什么?列两点。
- 应该是有d的,不过忘了
- 伪代码描述一个并行的,O(n)工作量,求最大值的并行算法,并给出p(n)。
- 加速比
- 计算在Amdahl下的加速比
- 计算在Gustafson下的加速比
- 考虑Sun-Ni,并且并行化额外开销是We(p),求线性加速比要满足的条件
- 将处理器组织成立方体,求SF下:
- 从最角落(0,0,0)一到多播送的时间开销。
- N为奇数,求最中间($\lfloor N \rfloor, \lfloor N \rfloor, \lfloor N \rfloor$)开始的一到多播送时间开销。
- 矩阵乘法相关问题
- 给出朴素并行矩阵乘法在二维环绕网孔上的时间开销分析
- 给出FOX矩阵乘法在二维环绕网孔上的时间开销分析,并说明它优化了什么
- 已知现在的串行矩阵乘法可以达到O(n^c) ( $2 \le c \le 2.5$),FOX是成本最优吗
- MPI
- 多选,MPI_Recv可以对应哪些发送方式
- 多选,MPI_Irecv可以对应哪些发送方式
- 更改一个MPI片段,支持双缓冲轮流切换。( Slides原题,但我不会(( )
- 一个OpenMP计算素数个数和最大素数的程序片段
- 给出三个并行域里潜在的性能问题。
- 优化它们,给出新的main函数。
- 一个使用Shared_memory计算矩阵乘法的cuda Kernel。
- 填空计算部分
- 什么是Bank Conflict,怎么避免?
- 正确填空后,该Kernel可能遇到Bank Conflict吗?
总体而言是一个能学到很多东西的课程,实验是按运行时间评分的(事实上等笔者考完数据库还得来继续优化代码),要和助教的版本比较性能,期末难度还算高(吗?)。
还没给分,所以给分好坏暂时先写一般。