一般情况下,用户选择安装方式为rpm包或者二进制压缩包,但是,通用安装包为了适应不同的软硬件平台,都会采用保守的源码编译方式,并使用特定的gcc参数可以使编译出的程序执行效率有较大提升。
gcc优化参数都是通过export命令设定CFLAGS和CXXFLAGS,然后configure的时候会自动读入,make的时候会自动使用所选的优化参数。
通过添加优化参数,让程序针对某个CPU型号和某个系统进行最大优化,减少文件大小、CPU使用率、内存使用率。优化后的程序,将不再具有跨系统跨平台的能力。
Alibaba大牛P.Linux通过调整gcc的编译参数,使MySQL 5.1.46sp1企业版,比Percona 5.1.47 Server性能高出15%,并非常稳定的运行在开发测试库上。
gcc CPU参数优化已经作为可选项添加到《lnmp最新源码一键安装包》
首先查看CPU信息,然后根据CPU信息到《Intel型号CPU的CFlags设置》、《AMD型号CPU的CFlags设置》去获取CPU优化参数。
-
# cat /proc/cpuinfo
-
processor : 0
-
vendor_id : GenuineIntel
-
cpu family : 6
-
model : 45
-
model name : Intel(R) Xeon(R) CPU E5-2670 0 @ 2.60GHz
-
stepping : 7
-
microcode : 0x70d
-
cpu MHz : 2600.038
-
cache size : 20480 KB
-
physical id : 0
-
siblings : 8
-
core id : 0
-
cpu cores : 1
-
apicid : 0
-
initial apicid : 0
-
fpu : yes
-
fpu_exception : yes
-
cpuid level : 13
-
wp : yes
-
flags : fpu de tsc msr pae cx8 sep cmov pat clflush mmx fxsr sse sse2 ss ht syscall nx lm constant_tsc rep_good nopl nonstop_tsc pni pclmulqdq ssse3 cx16 sse4_1 sse4_2 x2apic popcnt tsc_deadline_timer aes hypervisor lahf_lm ida arat epb pln pts dtherm
-
bogomips : 5200.07
-
clflush size : 64
-
cache_alignment : 64
-
address sizes : 46 bits physical, 48 bits virtual
-
power management:
从cupinfo的信息可以看出,支持sse/sse2/mmx这些GCC的flag,
查看gcc参数优化选项参考文档:[英文、中文]。
我这里的操作系统是64位,在编译源码之前执行如下代码即可调整gcc参数
- export CHOST=“x86_64-pc-linux-gnu”
- export CFLAGS=“-march=nocona -O3 -pipe -fomit-frame-pointer”
- export CXXFLAGS=“${CFLAGS}”
注意:gcc-4.2以上版本支持 -march=native 参数,gcc会自动选择最适合cpu的优化
-march=native 让它自己判断,是否支持native用下面的命令看看结果是否正常,和文档获取的参数不大相同
-
# touch o.c;gcc -v -march=native o.c 2>&1 | grep -o -- "-march[^ ]*" && rm -rf o.c
-
-march=core2