建议将性能调优集成到软件开发过程中。
性能问题的现状
传统的软件开发过程:分析、设计、编码、测试。
分析:用于评估需求、权衡各种架构的利弊以及构思高层抽象。
设计:依据分析阶段的基本架构和高层抽象,进行更精细的抽象并着手考虑具体实现。
测试:通常只包含功能测试。
遵循传统软件开发过程的应用,通常要到测试或即将发布时才会关注性能或扩展性。
对于分析阶段提炼出来的性能需求,建议以用例的方式特别标识出来,这有助于在分析阶段制定性能评估指标。
性能测试阶段:基准测试 性能测试
软件开发周期中的软件缺陷、低劣设计和糟糕实现发现得越晚,修复的代价就越大。
自动构建 自动测试 自动性能测试(统计方法、自动统计分析)
将性能测试集成到自动构建过程中后,每次代码变更提交到源代码库时,都能很容易地追踪因变更而导致的性能变化,也就能在软件开发的早期发现性能衰减。
性能分析的两种方法:自顶向下和自底向上
自顶向下:着眼于软件栈顶层的应用,从上往下寻找优化机会和问题。(应用开发人员)
自底向上:从软件栈最底层的CPU统计数据开始,逐渐上升到应用自身的结构或应用常见的使用方式。(性能问题专家)
自底向上,用以辨别因不同硬件架构、操作系统或不同的Java虚拟机实现所导致的性能差异。
自顶向下
从发现性能问题的负载开始监控应用。
需要持续监控应用。
自顶向下的第一步总是对运行在特定负载之下的应用进行监控。
监控的范围:操作系统、Java虚拟机、Java EE容器、应用的性能测量统计指标。
自底向上场景
在不同平台上
自底向上 监控CPU
需要收和监控最底层CPU的性能统计数据。
监控的CPU统计数据包括执行特定任务所需要的CPU指令数(路径长度),以及应用在一定负载下运行时的CPU高速缓存未命中率。
自底向上作用
自底向上关注的是在不更改应用的前提下,改善CPU使用率。但也可以给修改应用提交建议。
将经常使用的数据放在一起,使得只要访问一条CPU高速缓存行就能获取所有这些数据,而不用从内存获取数据。这可以降低CPU高速缓存未命中率,从而减少CPU等待内存数据的时间。
自底向上 操作
先从收集操作系统和JVM的统计数据开始。据此判断对应用和JVM进行性能分析是否有意义。
Java虚拟机集成了JIT编译期
现代Java虚拟机集成了JIT编译器,可以在Java应用的执行过程中进行优化。
依据应用的内存访问模式或应用特定的代码路径,生成更有效的机器码。
调整操作系统的设置来改善性能,比如更改CPU调度算法,修改操作系统的等待时间(操作系统在将应用执行线程迁移到其他CPU硬件线程之前所花费的时间)
选择正确的平台并评估系统性能
CPU架构
每核多硬件线程(CMT,Chip Multithreading)
随着CPU架构的演变发展,评估系统性能的方法也需要与时俱进。
选择正确的CPU架构
每核多硬件线程:在一个时钟周期内,每核多硬件线程中只有一个可以运行,如果发生长延迟,例如CPU高速缓存未命中,如果同一个核中还有其他就绪的硬件线程,下一个时钟周期就会让这个硬件线程运行。
每核单硬件线程:如果就绪的应用线程已经准备好运行去没有可用的硬件线程,运行前就必须进行线程上下文切换。
线程上下文切换需要耗费数百个时钟周期。
每核多硬件线程的CPU相对每核单硬件线程或者无法在下一个周期切换的CPU相比,运行的时钟频率较低。
每核多硬件线程:需要大量并发的线程,让大量硬件线程保持负荷,从而在发生例如CPU高速缓存未命中这样的事件时,发挥它在下一时钟周期切换到另一硬件线程的能力。