网站地图官方微信:
网站首页 岚水乡 付井镇 大祥区 岳溪镇 双板乡 甘江镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | Rust开发Web后端效率如何? |

    先叠几个定语: 你要是写Reactive Web,用Web ...

    查看详情>>
  • | 字节引入Rust是否代表J***a的缺点Go也没解决? |

  • | 米哈游创始人蔡浩宇称AIGC将彻底改变游戏行业,游戏创造只属于顶尖团队,普通开发者建议转行,如何理解? |

  • | 真的有这种又苗条身材又爆炸的么? |

  • | 为什么显卡官方指导价完全失效了? |

  • | 用J***a写Android的时代是不是要结束了? |

  • | Trae和Cursor对比有什么优势吗? |

  • | docker 容器启动后如何添加端口映射? |

  • | 为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到? |

  • | 选什么作为后端比较适合我,Django. Fastapi. Flask? |

  • | 你敢晒出你自己的照片吗? |

  • 公司内外都搭建过PVE集群,最早的快十年了。 目前来说,P...

    2025-06-22
  • 注意看,第二张图,有个大大的更改二字 只要你正常安装了其他*...

    2025-06-22
  • 在技术面试中,遇到过这样一个有意思的场景,且听我娓娓道来。 ...

    2025-06-22
  • 居然这么多答案都搞不清git的优势。 git的核心使用场景...

    2025-06-22

关注我们

添加微信好友,关注最新动态