网站地图官方微信:
网站首页 二站乡 山格镇 糜镇 竹林乡 蒙村镇 宝鸡市

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 群晖端部署了emby,盒子安装了客户端播放蓝光电影为什么不能显示影片自带字幕? |

    搭建了一个emby公益服,但是经常会出现欧美剧没有中文字幕的...

    查看详情>>
  • | 33岁P7研发从阿里巴巴离职了,回老家当个老师怎么样? |

  • | 以色列为什么要打伊朗? |

  • | 2025年了expo和Flutter学哪个? |

  • | 黑客为什么可以做到无需知道源码的情况下找出系统漏洞? |

  • | 如果我写个脚本,一直跌的股票一旦上涨就立刻(1s内)买,接着一旦下跌就立刻(1s内)卖,会怎样? |

  • | 如何基于Docker进行开发? |

  • | 为什么主流都不再力推英特尔 CPU? |

  • | 如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二? |

  • | 自己拥有一台服务器可以做哪些很酷的事情? |

  • | 如何看待使用mac mini当7*24h的服务器? |

  • 家里原先有两台双路E5-2680v4的服务器,但实在是太耗电...

    2025-06-22
  • 最近买了M4,蓝色,不说其他,单说颜值,这个主观性很强,我想...

    2025-06-22
  • MacOS的流畅,像是你在五星级酒店洗了个澡,毛巾有熏香、镜...

    2025-06-22
  • 谢邀。 大家别笑楼主。 这其实是一个很常见的高频交易策略。...

    2025-06-22

关注我们

添加微信好友,关注最新动态