自己之前一直没搞清楚这两个交叉编译器到底有什么问题,特意google一番,总结如下,希望能帮到道上和我有同样困惑的兄弟…..
一. 什么是ABI和EABI S3 S A% {3 S. P0 p$ O) z
1) ABI: 二进制应用程序接口(Application Binary Interface (ABI) for the ARM Architecture)
/ J, N& }: K, }在计算机中,应用二进制接口描述了应用程序(或者其他类型)和操作系统之间或其他应用程序的低级接口.
2 q% C, k, T. x& b" J6 O, qABI涵盖了各种细节,如:" l5 e: b2 b# k: D
数据类型的大小、布局和对齐;5 c$ u$ j8 T7 e# l: W0 p4 i
调用约定(控制着函数的参数如何传送以及如何接受返回值),例如,是所有的参数都通过栈传递,还是部分参数通过寄存器传递;哪个寄存器用于哪个函数参数;通过栈传递的第一个函数参数是最先push到栈上还是最后;
0 `! z) p6 Y: G/ r p) l系统调用的编码和一个应用如何向操作系统进行系统调用;4 q) `: p8 d/ s# y2 J0 E
以及在一个完整的操作系统ABI中,目标文件的二进制格式、程序库等等。
8 Z1 J, b! f8 C2 [7 q2 }- M ~* a* T4 j一个完整的ABI,像Intel二进制兼容标准 (iBCS) ,允许支持它的操作系统上的程序不经修改在其他支持此ABI的操作体统上运行。8 R/ W# J2 ]& x6 B; Z1 E
ABI不同于应用程序接口(API),API定义了源代码和库之间的接口,因此同样的代码可以在支持这个API的任何系统中编译,ABI允许编译好的目标代码在使用兼容ABI的系统中无需改动就能运行。
2) EABI: 嵌入式ABI
+ L2 C* d1 P L. U+ M* u嵌入式应用二进制接口指定了文件格式、数据类型、寄存器使用、堆积组织优化和在一个嵌入式软件中的参数的标准约定。9 I3 u& n- W; g1 {8 I
开发者使用自己的汇编语言也可以使用EABI作为与兼容的编译器生成的汇编语言的接口。
6 I/ m# M8 I6 W! _6 ?支持EABI的编译器创建的目标文件可以和使用类似编译器产生的代码兼容,这样允许开发者链接一个由不同编译器产生的库。8 X" `" {, U* t6 t9 c, e2 \
EABI与关于通用计算机的ABI的主要区别是应用程序代码中允许使用特权指令,不需要动态链接(有时是禁止的),和更紧凑的堆栈帧组织用来节省内存。广泛使用EABI的有Power PC和ARM.
二. gnueabi相关的两个交叉编译器: gnueabi和gnueabihf) H$ I o" _) v& i8 M, ~ m3 q
在debian源里这两个交叉编译器的定义如下:, O) U7 U3 N6 P& B- i
gcc-arm-linux-gnueabi – The GNU C compiler for armel architecture
! o' i, i; N) J: [3 o* _# g. Wgcc-arm-linux-gnueabihf – The GNU C compiler for armhf architecture( _: b; _4 G0 k- h E. n: B; K
可见这两个交叉编译器适用于armel和armhf两个不同的架构, armel和armhf这两种架构在对待浮点运算采取了不同的策略(有fpu的arm才能支持这两种浮点运算策略)
其实这两个交叉编译器只不过是gcc的选项-mfloat-abi的默认值不同. gcc的选项-mfloat-abi有三种值soft,softfp,hard(其中后两者都要求arm里有fpu浮点运算单元,soft与后两者是兼容的,但softfp和hard两种模式互不兼容):
6 O0 A; H! |' b/ g! osoft : 不用fpu进行浮点计算,即使有fpu浮点运算单元也不用,而是使用软件模式。$ b8 N* w5 e5 T2 [% N0 J9 s% U
softfp : armel架构(对应的编译器为gcc-arm-linux-gnueabi)采用的默认值,用fpu计算,但是传参数用普通寄存器传,这样中断的时候,只需要保存普通寄存器,中断负荷小,但是参数需要转换成浮点的再计算。: A* a" U7 o. j W
hard : armhf架构(对应的编译器gcc-arm-linux-gnueabihf)采用的默认值,用fpu计算,传参数也用fpu中的浮点寄存器传,省去了转换, 性能最好,但是中断负荷高。
把以下测试使用的c文件内容保存成mfloat.c:* S* a( i9 P- J* v7 ?" f; U' @
#include <stdio.h>& {# |9 I- w4 {0 }/ b% G4 n
int main(void). V( `; x) |8 ]$ n4 x0 n
{' b: }6 A9 {* M: |
double a,b,c;
6 N0 K+ g. G' G+ K0 Ta = 23.543;8 F# j f0 ]5 u8 m
b = 323.234;
( D8 X# ^2 z5 w# _: K0 P. z3 ~c = b/a;5 S. T, ~8 C6 b+ C2 J
printf(“the 13/2 = %f\n”, c);1 a' D1 t- t a! W) v
printf(“hello world !\n”);
9 a& J( z, ~, F6 @5 Hreturn 0;9 K5 [1 x$ S5 \2 y
}
1)使用arm-linux-gnueabihf-gcc编译,使用“-v”选项以获取更详细的信息:$ B3 u$ m) E2 G. F' F" N
# arm-linux-gnueabihf-gcc -v mfloat.c
$ S! [' }% G- K' h7 x/ D' YCOLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=hard’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’
1 ]8 P( v+ \/ Q6 G ?-mfloat-abi=hard,可看出使用hard硬件浮点模式。
2)使用arm-linux-gnueabi-gcc编译:
- y8 \; ?# b' y/ e$ R7 R# arm-linux-gnueabi-gcc -v mfloat.c
% Q/ Y4 y, H$ w1 g8 u8 E9 oCOLLECT_GCC_OPTIONS=’-v’ ‘-march=armv7-a’ ‘-mfloat-abi=softfp’ ‘-mfpu=vfpv3-d16′ ‘-mthumb’, [; H' @" I$ ~; J0 M
-mfloat-abi=softfp,可看出使用softfp模式。
三. 拓展阅读
: j8 K Q3 g0 b7 q下文阐述了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念
VFP (vector floating-point)
! r7 f: c$ v3 O从ARMv5开始,就有可选的 Vector Floating Point (VFP) 模块,当然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以配置成不带VFP的模式供芯片厂商选择。2 ]; B Q1 ?0 S4 L
VFP经过若干年的发展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16个浮点寄存器,默认为32个)和VFPv3+NEON (如大多数的Cortex-A8芯片) 。对于包含NEON的ARM芯片,NEON一般和VFP公用寄存器。
硬浮点Hard-float
. @4 w: l2 P7 h) e编译器将代码直接编译成发射给硬件浮点协处理器(浮点运算单元FPU)去执行。FPU通常有一套额外的寄存器来完成浮点参数传递和运算。
, p1 h( t( E0 i使用实际的硬件浮点运算单元FPU当然会带来性能的提升。因为往往一个浮点的函数调用需要几个或者几十个时钟周期。
软浮点 Soft-float6 I- {1 U6 t' p% r9 P% f% _
编译器把浮点运算转换成浮点运算的函数调用和库函数调用,没有FPU的指令调用,也没有浮点寄存器的参数传递。浮点参数的传递也是通过ARM寄存器或者堆栈完成。: g1 {- G( O1 C: r9 p+ r9 p, `
现在的Linux系统默认编译选择使用hard-float,即使系统没有任何浮点处理器单元,这就会产生非法指令和异常。因而一般的系统镜像都采用软浮点以兼容没有VFP的处理器。
armel ABI和armhf ABI
4 q; S2 m$ x" @/ w1 O$ J在armel中,关于浮点数计算的约定有三种。以gcc为例,对应的-mfloat-abi参数值有三个:soft,softfp,hard。
3 B! W3 i2 A6 J( Vsoft是指所有浮点运算全部在软件层实现,效率当然不高,会存在不必要的浮点到整数、整数到浮点的转换,只适合于早期没有浮点计算单元的ARM处理器;
! B0 Z- c7 C# \2 p3 Tsoftfp是目前armel的默认设置,它将浮点计算交给FPU处理,但函数参数的传递使用通用的整型寄存器而不是FPU寄存器;
' I0 S& g# _* F+ S6 h! phard则使用FPU浮点寄存器将函数参数传递给FPU处理。# B, t4 {* m! q9 `# n! s
需要注意的是,在兼容性上,soft与后两者是兼容的,但softfp和hard两种模式不兼容。
) H4 A: b- P( Z* Y' l默认情况下,armel使用softfp,因此将hard模式的armel单独作为一个abi,称之为armhf。
2 n8 G Y7 h8 q, c1 N5 _1 _' B6 B2 C0 x Y而使用hard模式,在每次浮点相关函数调用时,平均能节省20个CPU周期。对ARM这样每个周期都很重要的体系结构来说,这样的提升无疑是巨大的。
8 q9 s* F# o1 Z! G! \! T在完全不改变源码和配置的情况下,在一些应用程序上,使用armhf能得到20%——25%的性能提升。对一些严重依赖于浮点运算的程序,更是可以达到300%的性能提升。
Soft-float和hard-float的编译选项) N7 h& F4 [" }9 d
在CodeSourcery gcc的编译参数上,使用-mfloat-abi=name来指定浮点运算处理方式。-mfpu=name来指定浮点协处理的类型。
# u1 o( G, N \" N2 z# Q可选类型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。
- }; a; d9 O! \5 R5 S6 `# z使用-mfloat-abi=hard (等价于-mhard-float) -mfpu=vfp来选择编译成硬浮点。使用-mfloat-abi=softfp就能兼容带VFP的硬件以及soft-float的软件实现,运行时的连接器ld.so会在执行浮点运算时对于运算单元的选择,, I4 e2 h" K9 |0 I7 Z# k4 R3 P
是直接的硬件调用还是库函数调用,是执行/lib还是/lib/vfp下的libm。-mfloat-abi=soft (等价于-msoft-float)直接调用软浮点实现库。
在ARM RVCT工具链下,定义fpu模式:" P6 M( O& ^1 g. s+ H
–fpu softvfp
S* n9 Z! N6 S–fpu softvfp+vfpv2
- S. W4 \/ U; V5 U X! u–fpu softvfp+vfpv37 F) n" t+ {2 c3 ~# a! {
–fpu softvfp+vfpv_fp16! O3 ]! r2 [& Q* h* P, x# G- z
–fpu softvfp+vfpv_d16+ U8 s' i0 h/ {) ]/ s
–fpu softvfp+vfpv_d16_fp16.
定义浮点运算类型
3 t1 f# P: M0 Q" ]* L* R3 Z* ^–fpmode ieee_full : 所有单精度float和双精度double的精度都要和IEEE标准一致,具体的模式可以在运行时动态指定;
D D% u+ v6 z d6 C–fpmode ieee_fixed : 舍入到最接近的实现的IEEE标准,不带不精确的异常;# L) P3 n% t2 o5 X9 ]
–fpmode ieee_no_fenv :舍入到最接近的实现的IEEE标准,不带异常;
" q, E* F$ ~) M4 V) b. G–fpmode std :非规格数flush到0、舍入到最接近的实现的IEEE标准,不带异常;! b% z8 I. ~' O" ^& h) x
–fpmode fast : 更积极的优化,可能会有一点精度损失。
4 Y. V5 U5 d3 }, \0 W6 w) t' L5 {7 s5 o6 h: f