On this page

性能测试

性能测试代码以及对比测试结果

测试说明

为了更好的衡量 OGraph 的性能，本次测试以同类高性能 C++ 调度框架 CGraph 为基准，并与同语言 Go 调度框架 go-taskflow 进行对比。

在相同条件下运行 4 个场景并对比性能差异。

测试代码

为保证公平性，OGraph 测试用例采用与 CGraph 相同的设计。包含4个场景：

32 个节点，节点之间没有任何依赖关系
32 个节点，节点之间串行连接（n1->n2->…->n32）
6 个节点，构成简单的 DAG 图
64 个节点，分为 8 层，每层 8个节点，层与层全连接

OGraph 脚本：github.com/symphony09/ograph/test/benchmark.sh

OGraph 测试用例：github.com/symphony09/ograph/test/benchmark_test.go

CGraph 脚本：github.com/ChunelFeng/CGraph/CGraph-run-performance-tests.sh

CGraph 测试用例：github.com/ChunelFeng/CGraph/test/Performance

go-taskflow 测试用例：github.com/noneback/go-taskflow/benchmark/benchmark_test.go

测试结果

OGraph

[pipeline 循环执行 100 万次]
goos: linux
goarch: amd64
pkg: github.com/symphony09/ograph/test
cpu: AMD Ryzen 5 5600G with Radeon Graphics         
BenchmarkConcurrent_32-8         1000000              4308 ns/op            1592 B/op         16 allocs/op
BenchmarkSerial_32-8             1000000               281.7 ns/op           120 B/op          4 allocs/op
BenchmarkComplex_6-8             1000000              2762 ns/op            1048 B/op         21 allocs/op
BenchmarkConnect_8x8-8           1000000              8333 ns/op            2553 B/op         16 allocs/op
PASS
ok      github.com/symphony09/ograph/test       15.692s

CGraph

与OGraph 每个用例执行 100 万次不同，CGraph 4个用例分别执行了 50万、100 万、100 万、10 万次。

**** Running test-performance-01 ****
[2024-12-23 21:07:45.992] [test_performance_01]: time counter is : [4102.16] ms
 
**** Running test-performance-02 ****
[2024-12-23 21:07:46.567] [test_performance_02]: time counter is : [572.51] ms
 
**** Running test-performance-03 ****
[2024-12-23 21:07:50.611] [test_performance_03]: time counter is : [4042.16] ms
 
**** Running test-performance-04 ****
[2024-12-23 21:07:51.958] [test_performance_04]: time counter is : [1345.02] ms
 
 congratulations, automatic run CGraph performance test finish...

go-taskflow

goos: linux
goarch: amd64
pkg: github.com/noneback/go-taskflow/benchmark
cpu: AMD Ryzen 5 5600G with Radeon Graphics
BenchmarkC32-8             39032             30992 ns/op            7465 B/op        227 allocs/op
BenchmarkS32-8             15487             77402 ns/op            6908 B/op        255 allocs/op
BenchmarkC6-8             108658             10948 ns/op            1297 B/op         46 allocs/op
BenchmarkC8x8-8            14022             85813 ns/op           16957 B/op        503 allocs/op
PASS
ok      github.com/noneback/go-taskflow/benchmark       6.899s

结果分析

CGraph 4 个用例的 pipeline 执行次数分为 50w, 100w, 100w, 10w。

换算出每次执行时间分别为 8204 ns/op, 572 ns/op, 4042 ns/op, 13450 ns/op。

	CGraph（基准）	OGraph（本项目）	go-taskflow
场景一（无连接32节点）	8204 ns/op	4308 ns/op（+90.4%）	30992 ns/op
场景二（串行连接32节点）	572 ns/op	281.7 ns/op（+103%）	77402 ns/op
场景三（简单DAG 6节点）	4042 ns/op	2762 ns/op（+46.3%）	10948 ns/op
场景四（8x8全连接）	13450 ns/op	8333 ns/op（+61.4%）	85813 ns/op

从 4 个场景的测试用例结果来看，OGraph 与 CGraph 性能在同一量级，甚至在不少场景还能领先。

同时，在测试过程中，OGraph 的 CPU 占用率也明显低于 CGraph。

并发性能

OGraph pipeline 支持并发执行，在相同场景下，并发测试结果如下：

	OGraph（pipeline 循环执行）	OGraph（pipeline 并行执行）
场景一（无连接32节点）	4308 ns/op	3138 ns/op（+37.2%）
场景二（串行连接32节点）	281.7 ns/op	57.25 ns/op（+392%）
场景三（简单DAG 6节点）	2762 ns/op	747.8 ns/op（+269.3%）
场景四（8x8全连接）	8333 ns/op	5136 ns/op（+62.2%）

测试脚本： ograph/test/benchmark_parallel.sh at main · symphony09/ograph

附录

测试硬件

【CPU】AMD 5600G - 6 核心 12 线程

【内存】DDR4 32 GB

测试软件

【系统】Linux 6.11 - Fedora Workstation 41

【OGraph】v0.6.1 - Go 1.23.4

【CGraph】v2.6.2 - GCC14.2.1

Last updated 09 3月 2025, 23:31 +0800 . history

MapReduce

并行合并排序

性能测试

测试说明 link

测试代码 link

测试结果 link

OGraph link

CGraph link

go-taskflow link

结果分析 link

并发性能 link

附录 link

测试硬件 link

测试软件 link