软件性能测试有 6 个关键指标必须明确——并发用户数(CCU)、吞吐量(TPS/QPS)、平均响应时间、资源利用率、错误率、可用性(SLA)。这些指标在 GB/T 25000.51-2016「性能效率」维度中被归为时间特性、资源利用率、容量三个子特性。新亿诚通过为多类客户提供性能测试的服务经验,本文从指标定义、测试场景、达标值参考、报告内容四个层面把性能测试讲透,附行业基准与实操要点。
性能测试到底测什么?
性能测试的核心目标是回答:「系统在什么压力下还能正常工作?」
按 GB/T 25000.51-2016,性能效率分为三个子特性:
- 时间特性:响应时间、处理时间、吞吐量
- 资源利用率:CPU、内存、磁盘 IO、网络带宽占用情况
- 容量:最大可承载用户数、数据量、并发请求数
6 大关键指标详解
1. 并发用户数(Concurrent Users / CCU)
同一时刻向系统发起请求的用户数量。不等于在线用户数——后者大概是 CCU 的 5–10 倍。
- 电商秒杀:峰值 CCU 1 万–100 万
- 政企 OA:日常 CCU 几百–几千
- SaaS 多租户:CCU 100–5,000
- 政务公共服务:CCU 几千–几万
2. 吞吐量(TPS / QPS)
- TPS(Transactions Per Second):每秒事务数,「事务」是一组业务操作(如下单 → 支付 → 出货)
- QPS(Queries Per Second):每秒查询数,更适合纯查询接口
典型系统 TPS 目标参考:
| 系统类型 | TPS 目标 | QPS 目标 |
|---|---|---|
| 政务办事系统 | 50–500 | 200–2,000 |
| 电商交易系统 | 500–5,000 | 5,000–50,000 |
| 支付系统 | 1,000–10,000 | 10,000–100,000 |
| 大型互联网应用 | 5,000–50,000 | 50,000–500,000 |
3. 响应时间
用户发起请求到收到响应的总时长。业界普遍参考的 3-5-8 法则:
- 响应时间 ≤ 3 秒:用户感觉「快」
- 3–5 秒:用户感觉「能接受」
- 5–8 秒:用户感觉「慢」
- > 8 秒:30% 以上用户会放弃,体验严重受损
关键指标:
- 平均响应时间:所有请求响应时间的平均值
- P95 响应时间:95% 请求的响应时间在此值之内
- P99 响应时间:99% 请求的响应时间在此值之内(更能反映长尾性能)
4. 资源利用率
- CPU 利用率 ≤ 70%(持续高于 80% 即接近极限)
- 内存利用率 ≤ 80%
- 磁盘 IO ≤ 70%
- 网络带宽 ≤ 60%
资源利用率「踩线」的系统稳定性差,遇到突发流量易雪崩。
5. 错误率(Error Rate)
失败请求数 ÷ 总请求数 × 100%。健康系统:
- 普通业务:错误率 < 0.1%
- 金融、医疗:错误率 < 0.01%
- 极限压测下:错误率 < 1%
6. 可用性(SLA)
- 99%:每年宕机 87.6 小时(基本不可接受)
- 99.9%:每年宕机 8.76 小时(大多数政企系统目标)
- 99.99%:每年宕机 52.56 分钟(金融系统标准)
- 99.999%:每年宕机 5.26 分钟(电信级别)
性能测试 4 大场景
1. 基准测试(Baseline Test)
单用户单业务,建立性能基线。后续优化对比依据。
2. 负载测试(Load Test)
逐步增加用户数,观察系统在不同负载下的表现,找到「拐点」。
3. 压力测试(Stress Test)
持续加压至系统崩溃,找到「极限值」与「失效模式」。
4. 稳定性测试(Endurance Test)
在 70% 设计负载下持续运行 8–72 小时,观察内存泄漏、连接池耗尽等长尾问题。
性能测试报告必含内容
- 测试环境(硬件配置、操作系统、数据库版本,必须接近生产)
- 测试工具(JMeter、LoadRunner、Locust、Gatling 等)
- 测试场景设计(业务模型、并发模型、数据量)
- 各场景的测试结果(CCU、TPS、响应时间、资源利用率全部记录)
- 性能瓶颈分析(CPU、数据库、网络、应用代码等)
- 优化建议(短期 + 长期)
- 测试结论(明确「满足 / 部分满足 / 不满足」业务需求)
新亿诚性能测试服务
新亿诚提供:
- 支持大规模并发用户模拟
- 分布式压测集群
- 主流工具全覆盖:JMeter、LoadRunner、Locust、Gatling
- 报告依据 GB/T 25000.51-2016 国家标准
- CMA + CNAS 双重资质,报告全国互认
常见问题
性能测试需要在生产环境做吗?
不建议。生产环境压测有数据污染、服务中断风险。专业做法是搭建与生产 1:1 的预生产环境,使用脱敏后的真实业务数据进行压测。
压测多少用户合适?
没有固定答案。建议以「业务峰值用户数 × 1.5–2 倍」作为压测目标,预留 50% 增长空间。例如预期峰值 1 万 CCU,目标压测 1.5 万 CCU。
性能不达标怎么办?
三步优化:① 应用层(SQL 优化、缓存、异步化)→ ② 架构层(读写分离、分库分表、CDN)→ ③ 资源层(升级硬件、扩容)。一般应用层优化能解决 60–80% 的性能问题,避免盲目堆硬件。
具体的软件测试报告用途与报价咨询可直接联系顾问,1 小时内回电沟通。新亿诚作为持有 CMA + CNAS + ilac-MRA 国际互认协议的第三方软件测评机构,可为您提供本文场景下的检测服务。