链接脚本

kenson · 发表于 2016-12-6 14:03

摘要：    什么是链接脚本，就是用于告诉链接器如何把输入文件内的各个段（section）放到输出文件中，并控制输出文件中的各个段在此程序运行时的地址空间布局。一个程序由多个段组成，那么这些段是如何在文件中存放的，以及是如何加载到内存的相应位置进行执行的呢，这个就是通过连接脚本进行控制的。链接脚本格式...

什么是链接脚本，就是用于告诉链接器如何把输入文件内的各个段（section）放到输出文件中，并控制输出文件中的各个段在此程序运行时的地址空间布局。一个程序由多个段组成，那么这些段是如何在文件中存放的，以及是如何加载到内存的相应位置进行执行的呢，这个就是通过连接脚本进行控制的。

链接脚本格式：

链接脚本由一系列命令组成，每一个命令由一个关键字和相应的参数，或者一些赋值语句等组成。命令由分号进行分割。用/* */进行注释。

常见命令：

ENTRY（SYMBOL）；将SYMBOL的值设置成入口地址。一般设置为_start。

OUTPUT（FILENAME）；定义输出文件的名字。可以用它来指定默认的输出文件名称。当然我们一般都用手动-o进行指定，如果我们没有进行手动指定的话，输出文件名称就以这个FILENAME为输出文件名。

STARTUP（filename）；指定filename为第一个输入文件。

OUTPUT_FORMAT(default, big, little);定义3种输出文件的格式。若有命令行选项－EB（大端），则使用第二个输出格式，有命令行指定－EL（小端），则使用第三个格式。否则使用默认的default输出格式。

OUTPUT_ARCH(arch);设置输出文件的体系架构。

SECTIONS命令：最重要的，最基本的，也是最主要的命令，它告诉链接器如何把输入文件的各个section输出到目标文件中的各个section中去。

      SECTIONS命令的格式如下：

      SECTIONS
      ｛
            一条或者多条section-command
            或者符号赋值语句
      ｝

      section-command的常见格式如下：

      secname [address] : [AT(LMA)]
      { contents }

         首先中括号的选项是可选的，可以不写。

         secname, 指定输出的段名称。
         address, 表示程序的VMA地址。也就是表示当执行此程序的时候程序加载器应该把这个段加载到内存的哪个地址。如果没有指定这个地址，链接器根据定位符号‘.‘的值设置该section的VMA。
         AT, 后面跟LMA，这个是表示当我们把目标文件拷贝成二进制的时候，该段在文件中物理存放位置的偏移。这个可以用来把多个不同的部分的代码写到一个文件中，然后烧写到flash上去，然后，程序在运行的时候再把它从AT指定的位置读到内存的另外一个位置上去。

         contents，内容里面指定把哪些文件里面的哪些段或者该文件全部输出到secname所指定的这个段中。比如*(.text)就表示所有输入文件的.text段。括号外面表示文件名称，括号里面表示这些文件里面的什么段。

      例子：

         SECTIONS ｛
                  . = 0x30000000;       //表示设置当前符号的值为0x3000000
                  .text : { *(.text) } //表示把所有输入文件的代码段集合在一起，起始运行地址就为当前定位符号的值，-- 0x30000000
                  .rodata ALIGN(4) : {*(.rodata) } // 在输出文件中它紧挨着.text段存放。
         ｝


常见的例子：

（1）：

ENTRY(_start);
OUTPUT_FORMAT("elf32-littleARM", "elf32-bigarm","elf32-littlearm");
OUTPUT_ARCH(arm);

SECTIONS
{
      . = 0x50008000;

      . = ALIGN(4);
      .text : {
            *(.text);
      }

      . = ALIGN(4);
      .rodata : {
            *(.rodata);
      }

      . = ALIGN(4);
      .data : {
            *(.data);
      }

      . = ALIGN(4);
      .bss : {
            *(.bss);
      }
}

这个链接脚本表示代码段从0x30000000开始加载，然后后面的.rodata,.data,.bss段都分别加在其后，并且后面的每个段的起始地址是按照4个字节对齐的。

（2）：

ENTRY(_start);
OUTPUT_FORMAT("elf32-littlearm", "elf32-bigarm","elf32-littlearm");
OUTPUT_ARCH(arm);

SECTIONS
{
start 0x00000000 : { start.o }
main 0x30000000 : AT(4096) { main.o hello.o }
}

上面表示把start.o的运行地址指定为0x000000, 然后main.o hello.o程序的运行地址指定为0x30000000，当我们把链接后生成的可执行文件通过objcopy出来之后，那么start.o的二进制代码就从文件的0偏移开始存放，main.o hello.o就从同一个文件的4096这个位置开始存放。当时main.o hello.o是挨着存放的，并没有把他们的相同段放在同一个段里面。

======================================

ENTRY(_start);
OUTPUT_FORMAT("elf32-littlearm", "elf32-bigarm","elf32-littlearm");
OUTPUT_ARCH(arm);

SECTIONS
{
      first 0x0 : {
            LED.o
      }

      .text 0x30000000 : AT(4096){
            *(.text);
      }

      .text 0x32000000 : AT(5100){
            a*.o(.text)
      }

      .rodata : {
            *(.rodata);
      }

      .data : {
            *(.data);
      }

      _bss_start = .;
      .bss : {
            *(.bss);
      }
      _bss_end = .;
}

其实secname在copy成binary文件的时候已经没有了，这个只是在有操作系统的情况下才有用。因此在拷贝成二进制的时候，前面的段名称根本不是很重要，只是后面的的地址和在文件中的地址才是最关心的。

如果我们在SECTIONS内部定义了变量，那么这个相当于在这个位置定义了一个变量，如果我们要取这个变量地址，我们需要在C语言中使用&_bss_start来访问。

kenson · 发表于 2016-12-6 16:27

本帖最后由 kenson 于 2016-12-6 16:29 编辑

链接定位是系统级软件开发过程中必不可少的一部分,嵌入式软件开发均属于系统级开发,绝大部分嵌入式软件都涉及到链接定位脚本文件;链接定位脚本使得我们的目标代码组织更加灵活.

1)链接定位脚本文件说明
链接定位过程一般由链接器根据链接定位脚本完成,比较简单的系统可以通过设置链接器开关选项取代链接定位脚本;链接定位的关键是链接定位脚本的编写.我们从典型的目标文件结构开始,来介绍链接定位脚本文件的编写.下面是该系统一个目标文件的典型组织:

其中第二栏开始分别展示了该文件各个段(Sections)的属性:名称(Name),类型(Type),地址(Addr),偏移(Offs),大小 (Size),固定单元大小(Es),标志(Flg),连接依赖(Lk),附加属性(Inf),字节对其宽度(Al). 地址部分(Addr)描述了这一段在目标系统中的地址,而偏移(Offs)则记载了该段在目标文件中的偏移,大小(size)表示该段的实际长度;比如上图中.Text段的地址为0x0c700000,偏移为0x008000,大小为0x00d950,说明该段位于文件的偏移0x008000处,它将被下载到目标板0x0c700000处. 从段的分类来看,第7段以后的内容仅仅与调试有关,涉及到定位的也就是前面几段:.text,.data,.rodata,.bss,下面是一个具体的链接定位脚本文件:
SECTIONS
{
. = 0x0c200000; /*赋当前地址,后续的代码将从该地址开始存放 */
.text : { (.text) } /*.text段表示代码段,从0x0c200000开始放置代码*/

Image_RW_Base = .; /* RW(可写数据)基址,实际上是在这里声明了一个全局符号,我们可
以在程序中使用该符号,它等同于在代码中声明一个全局变量,但它的值由链接器指定,在这里"=."表
示该符号的值等于当前地址;下面的定义类似*/

.data : { (.data) } /*数据段, 保存已经初始化的全局数据 */
.rodata : { *(.rodata) } /*只读数据段, 保存已经初始化的全局只读数据*/

Image_ZI_Base = .; /*ZI基地址, 需要清零的区域 zero init*/
.bss : { *(.bss) } /*堆栈段,未初始化的全局变量也保存在此*/

__bss_start__ = .; /* bss的基地址*/
__bss_end__ = .; /* bss的结束地址*/

__EH_FRAME_BEGIN__ = .; /* FRAME开始地址(基地址)*/
__EH_FRAME_END__ = .; /* FRAME结束地址,gcc编译器使用 */

FAQ
PROVIDE (__stack = .); /* 当前地址赋给栈,栈地址一般是可读写区最高处*/

end = .; /* 结束地址*/
_end = .; /* 结束地址*/

.debug_info 0 : { *(.debug_info) } /*调试信息*/
.debug_line 0 : { *(.debug_line) } /*调试信息*/
.debug_abbrev 0 : { *(.debug_abbrev)} /*调试信息*/
.debug_frame 0 : { *(.debug_frame) } /*调试信息*/
}
text段是程序代码段,紧随其后的是几个符号定义,它们是由编译器在编译连接时自动计算的,当我们在链接定位文件中申明这些符号后,编译连接时,该符号的值会自动代入到源程序的引用中,如果你想进一步了解连接定位的一些含义,可以参考编程手册中的ld一章. data段的起始位置也是由连接定位文件所确定,大小在编译连接时自动分配,它和我们的程序大小没有关系,但和程序使用到的全局变量,常量数量相关. bss的初始值也是由我们自己定义的连接定位文件所确定,我们应该将它定义在可读写的RAM区内,stack的顶部在可读写的RAM区的最后,我们可以非常灵活的定义其起点和大小,但对大部分情况来说,程序区在ROM或FLASH中,可读写区域在SRAM或DRAM中,我们可以考虑一下自己程序规模,函数调用规模,存储器组织,然后参照一个连接定位文件稍加修改就可以了.

2)链接定位脚本修改实例
SECTIONS
{
. = 0x00000000; /*将代码段起始地址修改到0*/
.text : { *(.text) }
Image_RW_Base = .;
.=0xc0000000 /*设置数据段从0xc0000000开始存放*/
.data : { *(.data) }

.=0xd0000000 /*设置只读数据段从0xd0000000开始存放*/
.rodata : { *(.rodata) }

Image_ZI_Base = .;
.bss : { *(.bss) }
Image_ZI_Limit = .;

/*申明一个符号download_size */
download_size = SIZEOF(.text)+SIZEOF(.data)+SIZEOF(.rodata)+SIZEOF(.bss);

__bss_start__ = .;
__bss_end__ = .;

kenson · 发表于 2016-12-6 16:30

Linux链接脚本学习--lds

一、概论

ld:

GNU的链接器.

用来把一定量的目标文件跟档案文件链接在一起,并重新定位它们的数据,链接符号引用.

一般编译一个程序时,最后一步就是运行ld进行链接

每一个链接都被一个链接脚本所控制,这个脚本是用链接命令语言书写的.

二、链接脚本

链接脚本的一个主要目的是描述输入文件中的各个段(数据段,代码段,堆,栈,bss)如何被映射到输出文件中,并控制输出文件的内存排布.

链接器总是使用链接脚本的,如果你不提供,则链接器会使用一个缺省的脚本,这个脚本是被编译进链接器可执行文件的.

可以使用--verbose命令行显示缺省的链接器脚本的内容.

你可以使用-T命令行来提供你自己的链接脚本来替换缺省的链接脚本.

三、简单的链接脚本示例.

许多脚本是相当简单的.

可能最简单的脚本只含有一个命令:’SECTIONS’.

你可以使用’SECTIONS’来描述输出文件的内存布局.

‘SECTIONS’是一个功能很强大的命令.

假设你的程序只有代码段,初始化过的数据段,和未初始化过的数据段.这些会存在于’.text’,’data’,’bss’段中.

对于这个例子,假设代码应该被载入到地址0x1000处,而数据应该从0x8000000开始,如下是实现这个功能的脚本:

SECTIONS

{

.=0x1000;

.text:{*(.text)}

.=0x8000000;

.data:{*(.data)}

.bss:{*(.bss)}

}

具体分析:

关键字’SECTIONS’开始于这个配置.后面跟有一串放在花括号中的符号赋值和输出端描述的内容.

第一行是对一个特殊的符号’.’赋值,这是一个定位标识器.如果你没有以其他的方式制定输出段的地址,那地址值就会被设为定位标识器的现有值,即0x1000.

第二行定义一个输出段,’.text’.冒号’:’是语法需要,现在可以被忽略.段后面的花括号中,应该列出所有应该放入这个输出段中的输入端的名字.’*’是通配符,匹配所有文件名.即将所有输入文件中的.text段都保存在此段中.

余下的是.data和.bss段,同理,链接器会把所有.data段从地址0x8000000开始处放置.

最后,定位标识器的值变为0x8000000加上所有.data段的地址.此时链接器把所有.bss放在此处开始的地址.

四、简单的链接脚本命令

设置入口点

在运行一个程序时,第一个被执行到的指令成为”入口点”.你可以使用”ENTRY”链接脚本命令来设置入口点.参数是一个符号名,如下:

ENTRY(SYMBOL)

有很多不同的方法来设置入口点.链接器会通过按顺序尝试一下方法来设置入口点,如果成功了,就会停止.

1,’-e’ 入口命令行选项

2,链接脚本中的ENTRY(SYMBOL)命令

3,如果定义了start,就使用start的值

4,如果存在就使用’.text’段的首地址

5,地址’0’

五、命令行设置链接地址

ld用于将多个obj或者so(库)文件链接成可执行文件.

使用-T选项可以指定数据段,代码段,bss段起始位置.(-T只用于链接bootloader、内核等没有底层软件支持的软件.链接运行于操作系统之上的应用程序时,一般使用默认方式链接).

1,直接指定代码段、数据段、bss段起始地址

如下:

-Ttext startaddr

-Tdata startaddr

-Tbss startaddr

例如:

ld –Ttext 0x00000000 –g led_on.o –o led_on_elf

2,直接使用链接脚本来设置起始地址

ld –Ttimer.lds –o timer_elf a.o b.o

链接脚本timer.lds内容如下:

SECTIONS{

.=0x30000000;

.text : {*(.text)}

.rodata ALIGN(4) : {*(.rodata)}

.data ALIGN(4) : {*(.data)}

.bss ALIGN(4) : {*.(.bss) *(COMMON)}

}

一个SECTIONS命令内部包含一个或多个段,段(section)是连接脚本的基本单元,它表示输入文件中的某部分怎么放置.

kenson · 发表于 2016-12-6 16:31

ld链接脚本文件语法解析之一

连接脚本

**************

连接脚本的一个主要目的是描述输入文件中的节如何被映射到输出文件中,并控制输出文件的内存排布. 几乎所有的连接脚本只做这两件事情. 但是,在需要的时候,连接器脚本还可以指示连接器执行很多其他的操作.这通过下面描述的命令实现.

连接器总是使用连接器脚本的.如果你自己不提供, 连接器会使用一个缺省的脚本,这个脚本是被编译进连接器可执行文件的. 你可以使用'--verbose'命令行选项来显示缺省的连接器脚本的内容. 某些命令行选项,比如

'-r'或'-N', 会影响缺省的连接脚本.

你可以过使用'-T'命令行选项来提供你自己的连接脚本. 当你这么做的时候, 你的连接脚本会替换缺省的连接脚本.

你也可以通过把连接脚本作为一个连接器的输入文件来隐式地使用它,就象它们是一个被连接的文件一样.

基本的连接脚本的概念

============================

我们需要定义一些基本的概念与词汇以描述连接脚本语言.

连接器把多个输入文件合并成单个输出文件. 输出文件和输入文件都以一种叫做'目标文件格式'的数据格式形式存在. 每一个文件被叫做'目标文件'. 输出文件经常被叫做'可执行文件',但是由于需要,我们也把它叫做目标文件. 每一个目标文件中,在其它东西之间,有一个节列表.我们有时把输入文件的节叫做输入节; 相似的,输出文件中的一个节经常被叫做输出节.

一个目标文件中的每一个节都有一个名字和一个大小尺寸. 大多数节还有一个相关的数据块, 称为节内容. 某一个节可能被标式讵'loadable',含义是在输出文件被执行时,这个节应当被载入到内存中去. 一个没有内容的节可能是'allocatable', 含义是内存中必须为这个节开辟一块空间,但是没有实际的内容载入到这里(在某些情况下,这块内存必须被标式讵零). 一个既不是loadable也不是allocatable的节一般含有一些调试信息.

每一个loadable或allocatable的输出节有两个地址. 第一个是'VMA'或称为虚拟内存地址. 这是当输出文件运行时节所拥有的地址. 第二个是"LMA', 或称为载入内存地址. 这个节即将要载入的内存地址. 这大多数情况下这两个地址是相同的. 它们两个有可能不同的一个例子是当一个数据节在ROM中时, 当程序启动时,被拷贝到RAM中(这个技术经常被用在基于ROM的系统中进行全局变量的初始化). 在这种情况下, ROM地址就是LMA, 而RAM地址就是VMA.

你可以通过使用带有'-h'选项的'objdump'来察看目标文件中的节.

每一个目标文件还有一个关于符号的列表, 被称为'符号表'. 一个符号可能是定义过了的,也可能是未定义的.

每一个符号有一个名字, 而且每一个定义的符号有一个地址. 如果你把一个C/C++程序编译为一个目标文件,对于每一个定义的函数和全局或静态变量,你为得到一个定义的符号. 每一个在输入文件中只是一个引用而未定义的函数或全局变量会变成一个未定义的符号.

你可以使用'nm'程序来看一个目标文件中的符号, 或者使用'objdump'程序带有'-t'选项.

连接脚本的格式

====================

连接脚本是文本文件.

你写了一系列的命令作为一个连接脚本. 每一个命令是一个带有参数的关键字,或者是一个对符号的赋值. 你可以用分号分隔命令. 空格一般被忽略.

文件名或格式名之类的字符串一般可以被直接键入. 如果文件名含有特殊字符,比如一般作为分隔文件名用的逗号, 你可以把文件名放到双引号中. 文件名中间无法使用双引号.

你可以象在C语言中一样,在连接脚本中使用注释, 用'/*'和'*/'隔开. 就像在C中,注释在语法上等同于空格.

简单的连接脚本示例

============================

许多脚本是相当的简单的.

可能的最简单的脚本只含有一个命令: 'SECTIONS'. 你可以使用'SECTIONS'来描述输出文件的内存布局.

'SECTIONS'是一个功能很强大的命令. 这里这们会描述一个很简单的使用. 让我们假设你的程序只有代码节, 初始化过的数据节, 和未初始化过的数据节. 这些会存在于'.text','.data'和'.bss'节, 另外, 让我们进一步假设在你的输入文件中只有这些节.

对于这个例子, 我们说代码应当被载入到地址'0x10000'处, 而数据应当从0x8000000处开始. 下面是一个实现这个功能的脚本:

SECTIONS

{

. = 0x10000;

.text : { *(.text) }

. = 0x8000000;

.data : { *(.data) }

.bss : { *(.bss) }

}

你使用关键字'SECTIONS'写了这个SECTIONS命令, 后面跟有一串放在花括号中的符号赋值和输出节描述的内容.

上例中, 在'SECTIONS'命令中的第一行是对一个特殊的符号'.'赋值, 这是一个定位计数器. 如果你没有以其它的方式指定输出节的地址(其他方式在后面会描述), 那地址值就会被设为定位计数器的现有值. 定位计数器然后被加上输出节的尺寸. 在'SECTIONS'命令的开始处, 定位计数器拥有值'0'.

第二行定义一个输出节,'.text'. 冒号是语法需要,现在可以被忽略. 节名后面的花括号中,你列出所有应当被放入到这个输出节中的输入节的名字. '*'是一个通配符,匹配任何文件名. 表达式'*(.text)'意思是所有的输入文件中的'.text'输入节.

因为当输出节'.text'定义的时候, 定位计数器的值是'0x10000',连接器会把输出文件中的'.text'节的地址设为'0x10000'.

余下的内容定义了输出文件中的'.data'节和'.bss'节. 连接器会把'.data'输出节放到地址'0x8000000'处. 连接器放好'.data'输出节之后, 定位计数器的值是'0x8000000'加上'.data'输出节的长度. 得到的结果是连接器会把'.bss'输出节放到紧接'.data'节后面的位置.

连接器会通过在必要时增加定位计数器的值来保证每一个输出节具有它所需的对齐. 在这个例子中, 为'.text'和'.data'节指定的地址会满足对齐约束, 但是连接器可能会需要在'.data'和'.bss'节之间创建一个小的缺口.

就这样,这是一个简单但完整的连接脚本.

每个连接都被一个'连接脚本'所控制. 这个脚本是用连接命令语言书写的.

kenson · 发表于 2016-12-6 16:34

http://wenku.baidu.com/view/a3c428f4f61fb7360b4c6501.html

kenson · 发表于 2016-12-6 16:37

ld链接脚本语法简介

主要包含命令语句和赋值语句。

一、语法

1、分号，作为分隔符号

2、注释表达式和运算符  和c一样，其中注释只有/**/

3、字符引用  段名文件名等有特殊字符，使用双引号

4、命令语句

a、ENTRY（symble）  指定入口地址，入口地址就是进程执行的第一条用户空间的指令再进程地址空间中的地址，被指定再ELF文件头的ELF32_Ehdr的e_entry成员中。

ld有多种指定程序入口方式：(优先级逐渐降低)

ld -e

entry（）

_start符号

.text

0

b、STARTUP(filename)  将文件filename 作为链接过程中的第一个输入文件。

c、SEATCH_DIR 将路径path加入到ld链接器的库查找目录。 ld会根据指定的目录去查找相应的库。

d、INPUT(file,file,...)  将指定文件作为链接过程中的输入文件

e、INCLUDE filename 将指定文件包含进本链接脚本。

f、PROVIDE（symbol）在链接脚本中定义某个符号。该符号再程序中可以被引用，起始前文提到的特殊符号都是由系统默认的链接脚本通过PROVIDE 命令定义在脚本中的

最复杂的SECTIONS

SECTIONS

{

  secname : {contents}

}

secname 表示输出段的段名，后面必须有一个空格，使得输出段名没有歧义，后面根一个冒号和一对大括号。大括号里面的contents描述了一套规则和条件，表示符合这种条件的输入段合并到输出段中。输出段名必须符号输出文件的要求，例如：a.out 输出段名不可以是.text

.data .bss 之外的名字，因为.a.out 规定只允许这三个名。

有一个特殊的段名/DISCARD/如果使用这个名字作为输出，那么所有符合条件的段都丢弃

contents 规则

包含若干个条件，每个条件用空格分开，如果输入段符合任一条件，就表示符合cotents规则

输入规则：filename(sections)

ENTRY(nomain)  //指定了程序的入口地址

SECTIONS  //链接脚本的主体

{

  . = 0x08048000 + SIZEOF_HEADERS;  //将当前虚拟地址设置为0x08048000 + sizeof_headers.

其中 “.”表示当前虚拟地址

SIZEOF_HEADERS 表示文件的文件头大小

  tinytext : {*(.text) *(.data) *(.rodata)} //将所有输入文件中的三个段合并为输出文件中的 tinytext段。

  /DISCARD/ : {*(.comment)}  //将输入文件的comment段丢弃

}

zhixiaoyuhong · 发表于 2016-12-6 18:54

哇，很不错，讲的很好，顶一个。。。

		自动登录	找回密码
密码			请使用微信账号登录和注册会员