确实性能强大,我感觉单机TPC-H应该是跑的最快的了。
原理上,查询执行引擎做的非常极致。
Push模型,列存+并行处理+延迟物化技术,有一定的抗倾斜能力,哈希表的构建等细节技术都做的非常深入(执行引擎还有一个优化方向是查询编译,这个DuckDB是没有的)。
查询优化方面解任意子查询的技术也很厉害。
。
当前位置: 首页 >
确实性能强大,我感觉单机TPC-H应该是跑的最快的了。
原理上,查询执行引擎做的非常极致。
Push模型,列存+并行处理+延迟物化技术,有一定的抗倾斜能力,哈希表的构建等细节技术都做的非常深入(执行引擎还有一个优化方向是查询编译,这个DuckDB是没有的)。
查询优化方面解任意子查询的技术也很厉害。
。
对GPU进行性能优化时,cudagraph是绕不开的话题。 ...
有一次和朋友夜宵,高兴,烧鹅、叉烧、猪手…… 吃多了,半夜睡...
...