性能优化之几种常见压测模型及优缺点 | 陈显铭

    xiaoxiao2026-02-09  3

    上一篇讲的是《性能优化的常见模式及趋势》,今天接着讲集中常见的压测模型。

    通过上一章我们大概知道了性能优化的一些招式,但是怎么发现有性能问题,常见的模式还是需要压测。下面列举进行列举。

    压测模型抽象

    可以把压测模型抽象为上图的模型。

    压测环境准备

    压力机资源

    被压测系统

    依赖资源(压测数据,第三方依赖)

    压测策略准备

    压测需要达到的目标(比如期望达到的QPS,稳定性要求等)

    压测场景(业务场景选取、组合)

    压测策略(逐步加压、脉冲、并发量等)

    压测执行闭环

    压力机压测

    分析程序收集压测数据(RT,QPS/TPS,成功率,错误,内存,IO等)专业的工具基本涵盖

    分析压测报告

    确定优化计划

    反馈到压测系统或者调整压测策略

    线下压测模型

    此类压测模型最多,也是最容易实现的。有技术实力、资源的公司,开发环境和压测环境是隔离的。

    图中举例的是分布式系统结构的压测拓扑图,实线是同步调用,虚线是消息类调用。

    此类压测方式,最容易操作,有如下优点:

    可以实现快速压测

    压测场景可以自由自定

    可以进行稳定性测试或者链路性性能回归

    但是从执行来看缺点也很多

    仿真度不高

    环境部署复杂

    多个压测任务一般不能并行

    环境问题永远困扰你

    比如仿真度问题,环境问题永远困扰你

    依赖系统可能缺失

    数据可能确实

    使用的机器,网络,DB都和线上不一样。

    服务化后,线上各应用是集群部署,比如A可能是1000台,B可能是100台,是10:1的比例关系,但是线下一般是1:1,这个比例是失真的。

    线上引流压测模型

    此类压测模式是使用比较多的高仿真压测。

    有如下优点:

    真是的业务场景测试

    可以按需缩容

    可以快速回退

    缺点也有:

    对链路节点压测不了(DB流量可能不够,网络节点等)

    很难进行超出业务流量的压测

    很难评估链路性能

    线上引流压测是不错的压测模式,关键技术有

    流量的控制能力

    可以按需切换流量,web层诸如使用ngnix,服务和服务调用之间也需要按需切换。如果为了是自己对流量控制能力更强,都建议在需要控制的各层,加入代理层,这个代理层可以实现路由算法,通过调整路由算法,到达控制的目的。比如可以扩展ngnix的模块,如果是dubbo,可以扩展服务调用的寻址逻辑。

    服务监控能力

    如何在线上压测快速识别压测情况,如果压测是单台机器,登陆一台机器当然可以确认情况,但是如果有一堆机器,怎么办?必须自动化掉,监控核心指标。

    服务化后的系统使用普通的线上压测模式很难发现链路问题,所以现在有如下进阶的压测模式,外部也应该分享过。

    线上全链路压测模式

    现在阿里体系,已经实现了此类压测模式,用于对大促等爆发流量进行模拟。使用完全真实的线上环境,进行高仿真的线上压测,可以按照线上真实的容量部署情况进行链路压测。

    优点:

    高仿真

    按需的压测流量(可以构造比日常容量大得多的请求量)

    缺点:

    实施成本很高,一般的公司可以不这么玩,前面的方式已经够了。

    其他

    这几种模式主要就是现在使用的模式了,可能有变体,我想不会差的太大。

    压测的时候还有些注意点,诸如小心压力机的瓶颈;现在使用的比较多的工具是jmeter等。这些就不详解了。

    作者:征途小丘,陈显铭,蚂蚁金服技术专家,分享性能优化的常见模式及趋势

    原文链接:性能优化之几种常见压测模型及优缺点

    相关资源:机器学习模型性能测试(R,python)
    最新回复(0)