用户将X86平台下的MQ移植到信创平台下,性能表现如何?近期,深信服携手华锐技术完成了采用深信服信创超融合承载华锐AMQ分布式低时延消息中间件的兼容、可靠性验证,本文将分享相关的测试结果与调优思路,为金融用户在选型中提供参考。
华锐技术是分布式基础软件公司和证券资管行业核心业务平台提供商,自主研发的分布式架构下低时延消息队列产品AMQ,功能对标IBM MQ、Active MQ、Rocket MQ和Kafka等队列产品,并在可用性、可靠性、性能和灵活性方面都有明显提升,广泛的应用在银行、证券、基金等关键行业的核心场景。

MQ的典型应用场景主要有三个:
1. 流量削峰:在高峰期将流量限制在系统可承受的范围内,避免因为突发的大量请求导致系统崩溃。
2. 应用解耦:将系统中的不同模块解耦,使得可以独立地进行开发、部署和升级
3. 异步处理:主要应用于实时性要求不严格的场景,发送方将消息发送到队列后即可继续执行其他任务,而不需要等待接收方的即时响应。这种异步通信方式提高了系统的响应速度和吞吐量,使得系统能够更好地处理大量并发请求。
在鲲鹏服务器01上,开通一台虚拟化服务器,启动生产者(Producer)和消费者(Consumer)进程,并运行AMQ_Perf工具,构建压测机。
在鲲鹏服务器02和03上,各开通一台虚拟化服务器,部署AMQ集群,并且在AMQ集群开启持久化。通过AMQ_Perf工具可以实现生产者(Producer)不同速率下消息发送,以及统计消费者(Consumer)接收不同消息发送速率下的时延结果、吞吐量。
主要测试不同TPS压力下的响应时间&时延。响应时间即完成一次事务所需要的时间。一般从AVG、PCT90、PCT95、PCT99(PCT99可以简称P99)等多个维度去看。我们主要关注AVG和PCT99两个指标,其中AVG指标为P50\P90\P95\P99平均值。
表示平均时延(Latency),通常用于衡量消息处理的平均时间,包括消息从生产者发送到消费者接收并处理的整个过程。消息处理的平均时间是衡量MQ性能的重要指标,因为它直接影响到消息的延迟和系统的响应时间。一个较低的平均处理时间,意味着系统能够更快地处理消息,从而提高整体的吞吐率和效率。
PCT指标:
在MQ中间件中,PCT通常用于衡量消息处理时间的分布情况,可以反映消息队列在保证消息可靠传递方面的表现。例如,P95、P99等表示95%或99%的消息处理时间低于某个值。这种指标有助于识别系统中的异常情况和性能瓶颈。通过分析PCT,可以了解大多数消息的处理时间以及少数消息的延迟情况,从而优化系统配置和资源分配,确保系统的高可用性和稳定性
通过AVG和P99指标数据,以便更客观评价华锐AMQ在深信服信创超融合平台上的性能表现。
场景一:测试在X86裸金属运行RedHat系统下,AMQ的AVG和PCT99数据表现。
场景二:测试在未对超融合平台进行优化情况下,采用深信服信创超融合平台,创建麒麟虚拟机运行AMQ的AVG和PCT99数据表现。
场景三:测试在对超融合平台进行调优情况下,采用深信服信创超融合平台,创建麒麟虚拟机运行AMQ的AVG和PCT99数据表现。
通过以上三个场景的对比,可直观地查看在采用深信服信创超融合平台与X86裸金属架构下,承载AMQ产品在小规模TPS,中等规模TPS,以及极限45W TPS规模下的性能表现。
从测试场景二的采用深信服信创超融合(未调优)的测试结果中可以看出,在未调优的情况下,高压力超过15W TPS的P99响应时间波动大,时延达到秒级,不满足使用要求,在超过15W TPS情况下未记录数据。
从测试场景三的采用深信服信创超融合平台(调优)的测试结果中可以看出,调优之后,高压力超过15W TPS的P99响应时间波动小。
TPS在小于20W小压力场景下,深信服信创超融合性能略低于X86裸金属架构。
TPS在20W到35W之间,深信服信创超融合比X86裸金属架构性能提升10%。
TPS在45W高压力的场景下,深信服信创超融合比X86裸金属架构性能提升37%。
通过将X86裸金属架构下的P99(us)和深信服信创超融合对比:
TPS在性能极限45W以下,低于X86裸金属架构性能30%。
TPS在45W,深信服信创超融合比X86裸金属性能提升20%。
p99统计的是消息中时延最高的那一部分,这一部分通常是由于消息得不到CPU的及时处理导致了时延增加,对于单核性能的差距更加敏感。
从avg和P99指标来看,当TPS的压力越大,如avg的指标在大于35W时,P99的指标在极限45W时,深信服信创超融合平台性能会优于X86裸金属架构。在高压力场景下,深信服对超融合平台和虚拟机进行调优设置,保障资源能够得到有效的处理,调优手段如下:
在深信服信创超融合和X86性能对比中,深信服信创超融合得益于对平台调优,压力越大性能表现越好,尤其在极限45W TPS场景下,avg性能为29us,P99性能表现为85us,能够满足生产的场景的需求。
