天天新动态：聊一聊如何使用Crank给我们的类库做基准测试

2023-04-06 08:31:05 博客园

目录背景什么是 Crank入门示例Pull Request总结参考资料背景

当我们写了一个类库提供给别人使用时，我们可能会对它做一些基准测试来测试一下它的性能指标，好比内存分配等。

(资料图片仅供参考)

在 .NET 的世界中，用 BenchmarkDotNet 来做这件事是非常不错的选择，我们只要写少量的代码就可以在本地运行基准测试然后得到结果。

这个在修改代码的时候，效果可能会更加明显，因为我们想知道我们的修改会不会使这段代码跑的更快，占用的资源更少。

作一个简单的假设，根据测试用例，代码变更之前，某方法在基准测试的分配的内存是 1M，修改之后变成 500K，那么我们可以认为这次的代码变更是有性能提升的，占用的资源更少了，当然这个得在单元测试通过的前提下。

试想一下，如果遇到下面的情况

想在多个不同配置的机器上面运行基准测试，好比 4c8g 的windows, 4c16g 的 linuxPull Request/Merge Request 做代码变更时，如何较好的做变更前后的基准测试比较

这个时候就会复杂一点了，要对一份代码在多个环境下面运行，做一些重复性的工作。

那么我们有没有办法让这个变得简单呢？答案是肯定的。

我们可以用 Crank 这个工具来完成这些内容。

什么是 Crank

Crank 是.NET团队用于运行基准测试的基础设施，包括（但不限于）TechEmpower Web Framework基准测试中的场景。 Crank 第一次出现在公众的视野应该是在 .NET Conf 2021， @sebastienros 演讲的 Benchmarking ASP.NET Applications with .NET Crank。

Crank 是 client-server (C/S) 的架构，主要有一个控制器 (Controller) 和一个或多个代理 (Agent) 组成。其中控制器就是 client，负责发送指令；代理就是 server，负责执行 client 发送的指令，也就是执行具体的测试内容。

下面是它的架构图。

可以看到，控制器和代理之间的交互是通过 HTTP 请求来驱动的。然后代理可以执行多个不同类型的作业类型。

我们这篇博客主要讲的是图中的 .NET project Job。

先来看看官方仓库一个比较简单的入门示例。

入门示例

首先要安装 crank 相关的两个工具，一个是控制器，一个是代理。

dotnet tool update Microsoft.Crank.Controller --version "0.2.0-*" --globaldotnet tool update Microsoft.Crank.Agent --version "0.2.0-*" --global

然后运行官方仓库上面的 micro 示例，是一个 Md5 和 SHA 256 对比的例子。

public class Md5VsSha256{    [Params(100, 500)]    public int N { get; set;}    private readonly byte[] data;    private readonly SHA256 sha256 = SHA256.Create();    private readonly MD5 md5 = MD5.Create();    public Md5VsSha256()    {        data = new byte[N];        new Random(42).NextBytes(data);    }    [Benchmark]    public byte[] Sha256() => sha256.ComputeHash(data);    [Benchmark]    public byte[] Md5() => md5.ComputeHash(data);}

要注意的是 Main 方法，要用 BenchmarkSwitcher来运行，因为 Crank 是用命令行来执行的，会附加一些参数，也就是代码中的 args。

public static void Main(string[] args){    BenchmarkSwitcher.FromAssembly(typeof(Program).Assembly).Run(args);}

然后是控制器要用到的配置文件，里面就是要执行的基准测试的内容，要告诉代理怎么执行。

# 作业jobs:  # 作业名，自定义  benchmarks:    # 源相关内容    source:      # 这里是本地文件夹，也可以配置远程 repository 和分支      localFolder: .      # 这个是具体的 csproj      project: micro.csproj    # 一些变量    variables:      filterArg: "*"      jobArg: short    # 参数    arguments: --job {{jobArg}} --filter {{filterArg}} --memory    options:      # 使用 BenchmarkDotNet      benchmarkDotNet: true# 场景    scenarios:  # 场景名，自定义  Md5VsSha256:    application:      # 与前面的定义作业名一致      job: benchmarks# 档案profiles:  # 档案名，自定义  local:    jobs:       application:        # 代理的地址        endpoints:           - http://localhost:5010

下面先来启动代理，直接运行下面的命令即可。

crank-agent

会看到下面的输出：

[11:42:30 INF] Created temp directory "C:\Users\catcherwong\AppData\Local\Temp\2\benchmarks-agent\benchmarks-server-8952\2mmqc00i.3b1"[11:42:30 INF] Agent ready, waiting for jobs...

默认端口是 5010，可以通过 -u|--url来指定其他的；如果运行代理的电脑已经安装好 SDK 了，可以指定 --dotnethome避免因网络问题导致无法正常下载 SDK。

然后是通过控制器向代理发送指令。

crank --config C:\code\crank\samples\micro\micro.benchmarks.yml --scenario  Md5VsSha256 --profile local

上面的命令指定了我们上面的配置文件，同时还指定了 scenario 和 profile。因为配置文件中可以有多个 scenario 和 profile，所以在单次执行是需要指定具体的一个。

如果需要执行多个 scenario 则需要执行多次命令。

在执行命令后，代理里面就可以看到日志输出了：

最开始的是收到作业请求，然后安装对应的 SDK。安装之后就会对指定的项目进行 release 发布。

发布成功后就会执行 BenchmarkDotNet 相关的内容。

运行完成后会输出结果，最后清理这次基准测试的内容。

代理执行完成后，可以在控制器侧看到对应的结果：

一般来说，我们会把控制器得到的结果保存在 JSON 文件里面，便于后续作对比或者要出趋势图。

这里可以加上 --json 文件名.json。

crank --config C:\code\crank\samples\micro\micro.benchmarks.yml --scenario  Md5VsSha256 --profile local --json base.json

运行多次，将结果存在不同的 JSON 文件里，尤其代码变更前后的结果。

crank --config C:\code\crank\samples\micro\micro.benchmarks.yml --scenario  Md5VsSha256 --profile local --json head.json

最后是把这两个结果做一个对比，就可以比较清楚的看到代码变更是否有带来提升。

crank compare base.json head.json

上面提到的还是在本地执行，如果要在不同的机器上面执行要怎么配置呢？

我们要做的是在配置文件中的 profiles 节点增加机器的代理地址即可。

下面是简单的示例：

profiles:  local:    jobs:       application:        endpoints:           - http://localhost:5010  remote-win:    jobs:       application:        endpoints:           - http://192.168.1.100:9090  remote-lin:    jobs:       application:        endpoints:           - http://192.168.1.102:9090

这个时候，如果指定 --profile remote-win就是在 192.168.1.100这台服务器执行基准测试，如果是 --profile remote-lin就是在 192.168.1.102。

这样就可以很轻松的在不同的机器上面执行基准测试了。

Crank 还有一个比较有用的功能是可以针对 Pull Request 进行基准测试，这对一些需要基准测试的开源项目来说是十分有帮助的。

接下来老黄就着重讲讲这一块。

Pull Request

正常来说，代码变更的肯定是某个小模块，比较少出现多个模块同时更新的情况，如果是有，估计也会被打回拆分！

所以我们不会选择运行所有模块的基准测试，而是运行变更的那个模块的基准测试。

思路上就是有人提交 PR 后，由项目组成员在 PR 上面进行评论来触发基准测试的执行，非项目组成员的话不能触发执行。

下面就用这个 Crank 提供的 Pull Request Bot 来完成后面的演示。

要想用这个 Bot 需要先执行下面的安装命令：

dotnet tool update Microsoft.Crank.PullRequestBot --version "0.2.0-*" --global

安装后会得到一个 crank-pr的文件，然后执行 crank-pr的命令就可以了。

可以看到它提供了很多配置选项。

下面是一个简单的例子

crank-pr \  --benchmarks lib-dosomething \  --components lib \  --config ./benchmark/pr-benchmark.yml\  --profiles local \  --pull-request 1 \  --repository "https://github.com/catcherwong/library_with_crank" \  --access-token "${{ secrets.GITHUB_TOKEN }}" \  --publish-results true

这个命令是什么意思呢？

它会对 catcherwong/library_with_crank这个仓库的 Id 为 1 的 Pull Request 进行两次基准测试，一次是主分支的代码，一次是 PR 合并后的代码；基准测试的内容由 benchmarks，components 和 profiles 三个选项共同决定；最后两个基准测试的结果对比会在 PR 的评论上面。

其中 catcherwong/library_with_crank 是老黄提前准备好的示例仓库。

下面来看看 pr-benchmark.yml的具体内容

components:    lib:         script: |            echo lib        arguments:            # crank arguments            "--application.selfContained false"# default arguments that are always used on crank commandsdefaults: ""# the first value is the default if none is specifiedprofiles:    local:      description: Local      arguments: --profile local    remote-win:      description: windows      arguments: --profile remote-win     remote-lin:      description: linux      arguments: --profile remote-lin benchmarks:    lib-dosomething:      description: DoSomething      arguments: --config ./benchmark/library.benchmark.yml --scenario dosomething    lib-getsomething:      description: GetSomething      arguments: --config ./benchmark/library.benchmark.yml --scenario getsomething    lib-another:      description: Another      arguments: --config ./benchmark/library.benchmark.yml --scenario another

基本上可以说是把 crank的参数拆分了到了不同的配置选项上面去了，运行的时候就是把这些进行组合。

再来看看 library.benchmark.yml

jobs:  lib:    source:      localFolder: ../src      project: BenchmarkLibrary/BenchmarkLibrary.csproj    variables:      filter: "*"      jobArg: short    arguments: --job {{jobArg}} --filter {{filter}} --memory    options:      benchmarkDotNet: true  scenarios:  dosomething:    application:      job: lib      variables:        filter: "*DoSomething*"  getsomething:    application:           job: lib      variables:        filter: "*GetSomething*"  another:    application:           job: lib      variables:        filter: "*Method*"profiles:  local:    jobs:       application:        endpoints:           - http://localhost:9999    remote-lin:    jobs:       application:        endpoints:           - http://remote-lin.com  remote-win:    jobs:       application:        endpoints:           - http://remote-win.com

和前面入门的例子有点不一样，我们在 scenarios节点里面加了一个 variables，这个和 jobs 里面定义的 variables 和 arguments 是相对应的。

如果指定 --scenario dosomething，那么最后得到的 arguments 就是

--job short --filter *DoSomething* --memory

后面就是来看看效果了。

这里省略了评论内容的解析，也就是评论什么内容的时候会触发执行，因为这一块不是重点，有兴趣可以看 workflow 的脚本即可。

具体的执行过程可以参考

https://github.com/catcherwong/library_with_crank/actions/runs/4598397510/jobs/8122376959

当然，如果条件允许的话，也可以用自己的服务器资源来跑基准测试，不用 Github Action 提供的资源。

这样的好处是相对稳定，可以自己根据场景指定不同配置的服务器。不过对一些没那么复杂类库，用 Github Action 的资源也是无伤大雅的。

下面这个截图就是在提交到外部服务器上面执行的。

如果仓库不是在 Github，是在自建 Gitlab 或者其他的，就可以根据这个思路来自定义流水线从而去完成这些基准测试的操作。

总结

Crank 还是一个挺不错的工具，可以结合 BenchmarkDotNet 来做类库的基准测试，也可以结合 wrk/wrk2/bombardier/h2load 等压测工具进行 api/grpc 框架和应用的测试。

这里只介绍了其中一个小块的内容，还有挺多内容可以挖掘一下的。

最后是本文的示例代码：

https://github.com/catcherwong/library_with_crank

参考资料https://github.com/dotnet/crankhttps://github.com/sebastienros/aspnetcorehttps://github.com/martincostello/apihttps://github.com/aspnet/Benchmarks/blob/main/scenarios/efcore.benchmarks.yml

关键词：

责任编辑：宋璟

天天新动态：聊一聊如何使用Crank给我们的类库做基准测试

相关新闻

天天新动态：聊一聊如何使用Crank给我们的类库做基准测试

“广东好人”谭爱玲：用大爱报答大爱用志愿服务去“感恩”-独家焦点

61分！媒体人：王哲林展示了在常规赛MVP争夺战中最好的拉票方式

人大代表调研水务民生保障助力饮水安全工作|世界观速讯

一年级孩子在陵园找到了，多亏了这群“红五星”|全球观热点

当前快报:张继科的资产到底有多少？

元宇宙新鲜事|加拿大就数据安全问题开始调查OpenAI ChatGPT停售Plus服务

用旧照片忆清明，用老家书寄情思！奉贤掀起家风诵读活动缅怀先烈先辈

环球资讯：苹果将在印度开设首家官方零售店：外墙图片放出，本月开业

世界微动态丨今日4月05日13时四川阿坝疫情新增病例名单 4月05日13时四川阿坝最新疫情通报

电器辐射危久了怎么样?

维珍轨道公司正式进入破产程序寻求买家|天天快看点

【全球热闻】大风+阵雨！成都气温将跌至个位数

岚图3月交付量达到3027辆同比上涨116% 环球新动态

清风头条丨嘉禾县：为困难群众筑牢因病返贫防线-每日快讯

全球新动态：舍友摸我的打jj还弄射了的故事_舍友

大幅裁员后的森马服饰 2022年归母净利创上市12年历史新低_快看点

记者：葡萄牙体育主帅阿莫林不会是切尔西新帅人选

2023全国卫生资格考试准考证打印入口

卓创资讯换手率39.87%，5机构现身龙虎榜

4月4日大智慧涨停分析：金融科技，国产软件，彩票概念热股

环球今日报丨现代秘密停止了这种Creta变体知道为什么

天天资讯：两岸青年交流待夏至——访全国台联台胞青年夏令营参与者

当前讯息：AI图片引发混乱，欧盟将要求所有生成式AI内容必须注明来源

世界滚动:广绵LJ2标110KV高压线顺利完成迁改

日本每年约450所学校关闭，有中学只剩两个毕业生，马斯克警告：大清算即将到来！

全球最资讯丨2023年4月4日己二酸价格最新行情预测

「寻味中华｜饮食」清明寒食吃青团，品尝新绿江南春速递

越秀资本共10亿元公司债利率确定为3.15%及3.58%-当前简讯

数字化转型全面发力，23家券商去年IT投入合计超200亿元

4月3日基金净值：广发价值优势混合最新净值1.4447，涨0.54%

世界热点！黑牡丹(600510)：股东股份解除质押，剩余被质押股份0

世界快报:焊接技术专业院校排名求全国焊接技术与工程专业研究生较好的学校。 - 百...

文汇新民联合报业集团_关于文汇新民联合报业集团简介每日快报

一季度中国公路运输市场呈现较为景气运行态势