网站地图官方微信:
网站首页 洪水镇 伏岭镇 苍台镇 油溪乡 二圣镇 种蜂场

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么新流行的开源编辑器都在用Rust开发? |

    我大概能懂这种感觉... 我因为工作原因被逼着用了大半年ru...

    查看详情>>
  • | 为什么bilibili后端要用go来写? |

  • | 老公想要买2万左右的相机,我该同意吗? |

  • | 瑜伽裤和牛仔裤哪个更显身材? |

  • | 《欢天喜地七仙女》中 「仙女下嫁凡人」 的设定,在今天是否过时? |

  • | 为什么不用rust重写Nginx? |

  • | 大家猜猜伊朗的结局如何? |

  • | 如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑? |

  • | 你捡过最大的漏是什么? |

  • | 如何制造一个高级的阳谋? |

  • | 以色列为什么要打伊朗? |

  • 先写一个短的结论。 那就是AI Agent = 多个AI大...

    2025-06-20
  • 原创手绘006核动力航母 首先相较于之前的图做一个技术性调整...

    2025-06-20
  • 这么喜欢看露点的 那推荐一部俄罗斯的片子《契卡》 从头到尾都...

    2025-06-20
  • 正常,iOS7的时候也说丑,甚至比现在更甚。 但是...

    2025-06-20

关注我们

添加微信好友,关注最新动态