微信号:ita1024K

介绍:ITA1024-业界顶级技术分享系列活动

【干货】安卓包体压缩—分析Dalvik字节码进行减包优化

2016-09-02 18:09 互联网技术联盟

无论是开发还是发行,不可避免的会遇到包体过大需要压缩的情况。一般人通常通过检查Drawable资源、DailyBuild检查代码Diff等方式来做,本文的作者却另辟蹊径,反编译DEX看Dalvik字节码,直接从最底层定位是什么占用了包体积。


Android手机Qznoe最近几个版本在包大小配额上超标了,先后采用了包括图片压缩,功能H5,无用代码移除等手段减包,还是有着很大的减包压力。组内希望我能从代码的角度减少一些包大小,感觉有点压力山大。经过一段时间对手q安装包反编译后的Dalvik字节码的分析,发现通过调整Java代码可以减少编译后的Dalvik字节码,从而减少包大小。在这方面我做了许多的尝试,有成功有失败,拿出来给大家分享分享。


优化思路


通过dexdump反编译apk中的dex,得到对应Dalvik字节码,找到寻找冗余的字节码,尝试去除或替换冗余的字节码。


目前主要是替换或去除原有的java代码,减少对应的Dalvik指令,从而减少安装包大小。现在主要是从Dalvik字节码分析来调整Java代码,之后希望能够通过ASM等框架直接调整字节码减少现在的包大小。


优化效果


去除初始化赋值方案 ————减少整个手q的发布包大小80k左右。

插桩函数优化———减少整个手q的发布包大小2k左右。


其它尝试方案,包括字符串拼接、移除interface很多空方法等,因为效果比较小、难以统一修改等问题,只是列举下分析结果,大家如果项目中出现的量比较多也是可以尝试去优化的。


优化方案如下:


1、去除初始化赋值冗余


1.1、问题分析:


静态变量为类的所有对象共享,在类加载的准备阶段就会初始设置为系统零值(如下图),比如String被设置初始值为null,而在类中存在。




这样的赋值行为会在之后的<cinit>()类构造器方法中执行,重复设置String A为null,增加了对应的<cinit>()方法的Dalvik指令,没有必要,可以干掉。


成员变量在对象创建内存分配完成后,对应的内存空间会被初始设置为系统零值(和静态变量一样),比如int类型被设置为0,而在类中存在public int B=0;


这样的赋值行为会在之后的<init>()对象构造方法中执行,重复设置int B为0,增加了对应的<init>方法中的Dalvik指令,没有必要,可以干掉。




对于初始化赋值为系统分配默认零值的静态变量和成员变量,去掉初始化赋值,直接使用系统赋的系统零值,可以减少<cinit>和<init>中的Dalvik指令,从而减少包大小,而且可以提高类加载和对象创建的效率。




1.2、优化要点


注意对于static final的变量必须赋初值;

interface的变量都是static final类型的;

注意只有赋值为系统赋予的零值的静态变量和成员变量才能按照这种方式优化,其它比如局部变量的改动会导致编译不通过等问题。


1.3、冗余示例:


优化前:




对应字节码:




优化后:




对应字节码:




减少了两行Dalvik指令的执行,最后分析结果平均优化一处可以减少安装包8个字节左右。


1.4、优化结果:


目前在手Q6.3.0分支上利用自行写的过滤脚本(可以私下找我要对应的优化脚本用于对应的工程)可以看到优化的效果,如果对整个手q执行这个方案,预计能够优化80k左右,修改了4677个文件,修改了17164处冗余。


2、调整插桩对应的代码


Qzone补丁包引入了插桩这一步,需要在所有qzone类的构造函数中加入对mqq.app.MobileQQ类的引用。

优化的方案是将插桩插入到对象构造函数中的语句由




改为




以Qzone某个类的<init>为例,由原本的字节码




变成了




这里替换一处代码,将System.out.print改成getName,可以减少对象构造函数的一行Dalvik指令,替换了1314处初始化函数中插入的代码,最终将对应的qzone_plugin.apk减少了2459字节,整个手q减少2457字节左右。<font color=#FF0000>一行代码,2k收益</font>,其实还是很划算的。


3、字符串拼接


下面是我针对String拼接的特殊情况“变量+”””和“””+变量”的不同形式举例分析Dalvik字节码。





字节码




从示例中可以看出各类字符串拼接方式的优劣,如果用String.valueOf()绝对是最优方案。只是通过对“变量+”””和“””+变量”的形式在手q整个项目调整以后大概能够优化6k左右,如果只是优化Qzone部分,效果比较微小,脚本方面不太好过滤对应情况,暂时没有加入,只是做了下试验。

PS:其实“String +”一般来说比StringBuffer的拼接更费字节码,这个部分可以自行验证,前提是a+b+…的形式中首位a这个为变量,而不是常量,如果a是常量,则实际上和StringBuffer等同,这也是个优化点。


4、调整interface到class,减少实现接口造成的空方法


很多代码中实现接口时有很多的空方法,并没有作用但还是会占用字节码,希望能够通过调整对应的interface为class,去除冗余的空方法,减少字节码,从而减少包大小。


示例如下:




改成




该方案的缺点在于修改必须手动,难度大,Qzone中场景不足以引起量变,而且因为Qzone中<init>中还加入了插桩函数的负担,所以整体优化效果不佳,优化完Qzone才2k不到的大小缩减,优化难度高收益小,弃坑。


这些减包思路希望能够给一起在减包路上踩坑的朋友们一些帮助吧。


本文已获得授权转载

文章来源:  腾讯WeTest    (微信号:TencentWeTest)

作者:frost

著作权归作者所有。如需转载请联系 腾讯WeTest 获得授权。




更多"互联网+"案例,请阅读原文,访问ITA1024 中国互联网+第一网站。


中国互联网+第一网站
abc.ita1024.com


中国互联网技术联盟以“技术驱动 跨界连接 合作创新”为使命,联合国内所有一线互联网公司、电商公司、技术公司、资本机构、媒体机构、政策研究机构,整合社会化资源、打造社会化组织、建立社会化服务平台。


为互联网企业和传统企业“互联网+互联网”升级转型战略提供必要的专家资源、媒体资源、资本资源、技术资源。

为企业提供有价值的资讯&数据服务、跨界连接服务、“互联网+”商学院服务/技术学院服务/专家服务、媒体包装推广服务、融资对接服务。

 
互联网技术联盟 更多文章 化塑汇:用中后台技术构建竞争壁垒,今年预期营收80亿 | 互联网+化工 “1+N+L”模式供应链金融,怡亚通用生态链打造独角兽 | 互联网+案例 【互联网+成功案例】韩都衣舍都做对了哪些事儿 良品铺子CEO杨银芬:我们是一个技术公司 产业链平台三只松鼠是怎么玩转互联网的?
猜您喜欢 单表60亿记录等大数据场景的MySQL优化和运维之道 | 高可用架构 有了这样的编程学习工具,再学不好,就是你不努力了! Gartner:CIO们最应该消除的八个大数据神话 程序员的《权利法案》 耐撕攻城狮们的六一礼物应该是什么样的