微信号:woodywangjinsong

介绍:永远免费的测试原创视频和测试好文!

黑盒测试进阶之后端server巧用对比测试

2016-11-15 09:00 郑群花

       Hello ,大家好~我们是每周三的黑盒测试组,我们专注于黑盒测试过程中的一切,包括但不局限于总结现有的工作成果,发掘新的工作方法,探寻高效的测试工具等,所有与黑盒测试相关的话题都可以在这里讨论。


(群号:219234105,或者直接扫描上方二维码)

一、 什么是对比测试

一般而言,对比测试是一种将两个可比较的对象、在相同的环境下、使用特定的工具或方法等进行比较后,分析两者之间的变化情况是否有潜在风险、是否符合测试预期的方法。

二、 为何要做对比测试

后端server测试常遇到这样的问题:测试某些任务如server重构或业务逻辑特别复杂、引入新计算模型等任务时,小数据集的功能测试和大数据集的性能测试,并不能可靠地评估性能、效果变化是否符合预期。对比测试能在数据多样、逻辑繁多复杂的测试任务中,帮助测试人员发现更多待测对象内部问题, 更全面地保证任务的测试质量、降低出现问题的风险。

三、 对比测试适用对象

需要评估性能、效果变化影响的持续迭代的server或流程测试任务,以及需要验证功能是否一致但功能自动化测试覆盖率低的server或流程测试任务。

四、 如何做对比测试

后端server对比测试的常规操作方法是,尽可能保持测试环境一致性前提下,通过对新旧两版server分别进行同大数据量输入,结束后统计和对比日志,得到对比结果。

对比测试一般有功能一致性对比、效果对比和性能对比。通常情况下,同server的版本迭代,不会引起性能、效果等的大幅度变化。

功能一致性对比

功能一致性对比指将新旧版server输出结果相关日志按字段逐一进行异同比较,预期结果是除时间、随机字段等不确定或无意义字段外,其他字段值对比一致。一致性对比对测试环境要求很高,除了新旧版本运行环境一致外,还需事先排除环境配置和数据中不可控因素如流量比例。

案例

在商业广告后端server测试中一致性对比亦发挥极其重要的作用。某测试任务的测试场景是广告server的某个id从32位升至64位,涉及到id定义、赋值、输出等升级修改,但不涉及server代码逻辑变动。由于广告server功能模块多,逻辑复杂,代码量大,若仅仅采用代码走读方法测试需要测试人员非常熟悉server全部代码且火眼金睛,同时有足够长的测试时间,否则遗漏未改处不易发现,以致导致极严重后果。而采用一致性对比测试,若某正常日志字段对比不一致,即可定位到某处id未修改或修改错误。

 

 

上图是server log中的查询词返回广告对比结果示意图,通过逐字段对比可见日志35字段有差异,同时本次打压发现有8%的结果数据有差异,通过该差异定位到server某功能模块代码中id修改遗漏导致数据截断,业务逻辑失效。    

效果对比

服务效果有对应的效果指标,如消耗(收益)、过滤比例等。为了能尽快在比较中发现问题,设定的效果指标要全面、并逐级细化。

案例

消耗对比常用于评估商业广告后端server提升或优化效果。从总体消耗入手,细化到各个渠道或策略,再进一步细化到各个广告位,分渠道分广告位统计和对比消耗,并给出差异情况。通常情况,一定比例范围内的差异如2%属于正常情况。

消耗对比在商业广告后端的Xserver中统计,该server日志记录了与消耗统计相关的多个信息字段。评估后端某个server对广告消耗的影响时,可通过搭建整套的商业广告后端server测试拓扑,对比测试时仅切换待测server新旧版本。如下图所示是某次测试任务消耗对比图之一,可见新server广告效果有一定幅度提升。   性能对比

通常性能测试是获得server在某种特定条件下的性能指标数据,作为后续的参考和对比依据,其往往受硬件系统、测试环境(配置和数据)等外在因素影响,易与标准值产生偏差。性能对比不失为一种独辟蹊径的性能评估方法,其可将外在因素导致的偏差降到最低,同时测试人员亦不必准确掌握服务各性能指标的标准值。

案例一

性能对比常用于评估商业广告后端server的性能影响,测试时除了采用部分通用性能测试指标外,还可根据待测server的自身特点和测试目的建立特有性能指标。在某server性能对比测试中,采用如下性能指标:CPU、虚存、实存、负载均值、句柄数、平均响应时间、总超时率、rs超时率、qs超时率、丢包率10个指标。

特有性能指标对比:


    通用性能指标对比


如上图所示是该server某测试任务的性能对比图,其任务场景是server新增一接口字段代替原有字段并更新对应逻辑,server整体功能不变,评估性能影响。对比结果一目了然:新server平均响应时间增加 0.05ms,其他指标不变(系统负载正常波动),经评估这个结果符合预期。

案例二

     案例一server在某次重构测试任务中,性能对比结果除句柄数外其他9个指标不变(系统负载正常波动),句柄数有变化这不符合预期(如下图所示)。经检查发现句柄泄露,这是由于新server不断创建线程却未相应调用CloseHandle进行释放,导致句柄数量不断增加,而操作系统对句柄最大数量是有限制的,在达到最大数量后将会导致server停止提供正常服务。

五、 对比测试平台化

上述三种对比测试方法均没有特定的比较工具,需要根据需求,编写脚本或代码完成各项数据或指标对比。根据测试经验,为保证对比测试结果的可靠性,每次测试任务中同种对比测试平均进行三次,观察三次对比结果是否稳定。同时对比测试时务必确保新旧server运行环境的一致性。这些工作包括操作测试、收集测试结果等都非常耗时间人力,也易出差错,为了提高测试效率和质量,亟需对比测试平台化,通过测试平台自动地完成测试环境准备,测试数据收集及测试结果展示。

目前商业测试团队开发了自动化、可视化的测试平台,提供测试环境的一键式部署和一致性对比,支持多种测试类型的自动化测试,支持测试数据自动收集,并提供多种报表形式展示结果数据。对比测试亦已纳入平台,并正逐步完善中。

 

 

对比测试作为一种辅助测试手段,在持续迭代的后端server的巧用能有效提高测试效率、保证测试质量。本文希望带给大家一种不同的思路,也欢迎大家一起探讨。


 
金阳光自动化测试 更多文章 搞定Android代码bug必杀技能 这些年我们一起追的Android 用例覆盖度提高之服务器交互功能 Espresso实战:快速的Android UI自动化测试 微软发布《安全情报报告20卷》报告:90%恶意网页发现于Flash
猜您喜欢 【视频】►智能手表漏洞:可获取位置,窃听通话 2016安卓开发资料大全 不看好远程医疗的人 也许该看看这些即时诊断检测设备 手机游戏的3个测试阶段 赠书活动:《自己动手写Java虚拟机》