网站地图官方微信:
网站首页 景和镇 阳城县 长甸镇 艾城镇 迎阳乡 杨万乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 你在出租房屋发现过什么前租客留下的“宝藏”? |

    一个2TB的移动硬盘,里面有6万张美女图片,好家伙居然有几十...

    查看详情>>
  • | 眼睛有飞蚊症可以自愈吗? |

  • | 如果发动机热效率达到100%,一升汽油大概可以让汽车行驶多少公里? |

  • | 中国军队有多强,在世界能排第几? |

  • | 印度真的有部分中国新闻上说的那么落后吗? |

  • | 上海首例认定提供爬虫程序抓取公开数据构成提供侵入计算机信息系统程序罪案,该案件有哪些细节值得关注? |

  • | “哨兵模式”涉嫌泄密,你支持封杀特斯拉吗? |

  • | ant-design-vue 社区为什么不维护了? |

  • | ***如古代长城用的是C140混凝土,那千百年下来会完整的留存至今还是损坏的更加严重? |

  • | 学习linux内核有什么好的书吗? |

  • | 你见过哪些智障的反人类的设计? |

  • 我的头发到我屁股,夏天每三天洗一次。 洗头的顺序是先用控油...

    2025-06-21
  • 团队 code review 时,一位同事把 count(*...

    2025-06-21
  • 一个个危言耸听,拿着鸡毛当令箭,像极了装在套子里的别里科夫:...

    2025-06-21
  • 其实吧,破局的方法也很简单: 这是伊朗导弹上掉下来的火箭...

    2025-06-21

关注我们

添加微信好友,关注最新动态