网站地图官方微信:
网站首页 桃源乡 相思乡 贵屿镇 鱼鳞乡 交通乡 倾多镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 巅峰期的成龙身体素质是怎么一种存在? |

    前两天正好看了成龙的《八十天环游地球》,看到大哥和州长同框时...

    查看详情>>
  • | Vim 有什么奇技淫巧? |

  • | 广州的公共交通为什么这么烂? |

  • | 老饭骨做的饭真的好吃吗 ? |

  • | 为什么 Blender 成功了? |

  • | 男人最无声的炫耀是什么? |

  • | 如何看待雷军称小米YU7定价不会是23.59万,还说汽车业务今年内盈利? |

  • | 住家保姆为什么总干不长? |

  • | duckdb的性能如何? |

  • | 有性瘾女朋友每天都要很多遍要不要分手? |

  • | 周杰伦为什么不告粥饼伦黑伦侵犯他的名誉权? |

  • 理论方面我不太了解,我认为是肌肉力量的关系。 比如你做引体...

    2025-06-19
  • 那自然是刘亦菲打枪图: 这颜值,这发量,这腰身,这曲...

    2025-06-19
  • 警告一些私信骚扰攻击的,我会用最恶毒的语言攻击回去,别自讨没...

    2025-06-19
  • 小米不是不想改款,而是已经骑虎难下了没办法改款为什么骑虎难下...

    2025-06-19

关注我们

添加微信好友,关注最新动态