本文共 3433 字,大约阅读时间需要 11 分钟。
__asm__ __volatile__内嵌汇编用法简述 在阅读C/C++原码时经常会遇到内联汇编的情况,下面简要介绍下__asm__ __volatile__内嵌汇编用法。
带有C/C++表达式的内联汇编格式为:
其中每项的概念及功能用法描述如下:
1 、 __asm__
__asm__ 是 GCC 关键字 asm 的宏定义:
#define __asm__ asm
__asm__ 或 asm 用来声明一个内联汇编表达式,所以任何一个内联汇编表达式都是以它开头的,是必不可少的。
2 、 Instruction List
Instruction List 是汇编指令序列。它可以是空的,比如: __asm__ __volatile__(""); 或 __asm__(""); 都是完全合法
的内联汇编表达式,只不过这两条语句没有什么意义。但并非所有Instruction List 为空的内联汇编表达式都是没有意
义的,比如:__asm__("":::"memory");
就非常有意义,它向 GCC 声明: “ 内存作了改动 ” , GCC 在编译的时候,会将此因素考虑进去。 当在"Instruction List"中有多条指令的时候,可以在一对引号中列出全部指令,也可以将一条
或几条指令放在一对引号中,所有指令放在多对引号中。如果是前者,可以将每一条指令放在一行,如果要将多
条指令放在一行,则必须用分号(;)或换行符(\n)将它们分开. 综上述:(1)每条指令都必须被双引号括起
来 (2)两条指令必须用换行或分号分开。
例如: 在 ARM 系统结构上关闭中断的操作
3. __volatile__
__volatile__ 是 GCC 关键字 volatile 的宏定义
#define __volatile__ volatile
__volatile__ 或 volatile 是可选的。如果用了它,则是向 GCC 声明不允许对该内联汇编优化,否则当 使用了优化选项 (-O) 进行编译时, GCC 将会根据自己的判断决定是否将这个内联汇编表达式中的指令优化掉。
4 、 Output
Output 用来指定当前内联汇编语句的输出
例如:从 arm 协处理器 p15 中读出 C1 值
5、 Input
Input 域的内容用来指定当前内联汇编语句的输入 Output 和 Input 中,格式为形如 “constraint”(variable) 的列表(逗
号分隔)
例如:向 arm 协处理器 p15 中写入 C1 值
6.、Clobber/Modify
有时候,你想通知 GCC 当前内联汇编语句可能会对某些寄存器或内存进行修改,希望 GCC 在编译时能够将这一点
考虑进去。那么你就可以在Clobber/Modify域声明这些寄存器或内存。这种情况一般发生在一个寄存器出现在
"Instruction List",但却不是由Input/Output操作表达式所指定的,也不是在一些Input/Output操作表达式使用"r"
约束时由GCC 为其选择的,同时此寄存器被"Instruction List"中的指令修改,而这个寄存器只是供当前内联汇编临
时使用的情况。
例如:
__asm__ ("mov R0, #0x34" : : : "R0");
寄存器 R0 出现在 "Instruction List 中 " ,并且被 mov 指令修改,但却未被任何 Input/Output 操作表达式指定,所以你
需要在Clobber/Modify域指定"R0",以让GCC知道这一点。
因为你在 Input/Output 操作表达式所指定的寄存器,或当你为一些 Input/Output 操作表达式使用 "r" 约束,让
GCC为你选择一个寄存器时,GCC对这些寄存器是非常清楚的——它知道这些寄存器是被修改的,你根本不需要
在Clobber/Modify域再声明它们。但除此之外, GCC对剩下的寄存器中哪些会被当前的内联汇编修改一无所知。
所以如果你真的在当前内联汇编指令中修改了它们,那么就最好在Clobber/Modify中声明它们,让GCC针对这些寄
存器做相应的处理。否则有可能会造成寄存器的不一致,从而造成程序执行错误。
如果一个内联汇编语句的Clobber/Modify域存在"memory",那么GCC会保证在此内联汇编之前,如果某个内存的内容被装入了寄存器,那
么在这个内联汇编之后,如果需要使用这个内存处的内容,就会直接到这个内存处重新读取,而不是使用被存放
在寄存器中的拷贝。因为这个 时候寄存器中的拷贝已经很可能和内存处的内容不一致了。
这只是使用 "memory"时,GCC会保证做到的一点,但这并不是全部。因为使用"memory"是向GCC声明内存发生了变化,而内存发生变
化带来的影响并不止这一点。
例如:
本例中,如果没有那条内联汇编语句,那个if语句的判断条件就完全是一句废话。GCC在优化时会意识到这一
点,而直接只生成return 5的汇编代码,而不会再生成if语句的相关代码,而不会生成return(*__p)的相关代码。
但你加上了这条内联汇编语句,它除了声明内存变化之外,什么都没有做。但GCC此时就不能简单的认为它不需
要判断都知道 (*__p)一定与9999相等,它只有老老实实生成这条if语句的汇编代码,一起相关的两个return语句
相关代码。
另外在 linux 内核中内存屏障也是基于它实现的 include/asm/system.h 中# define barrier() _asm__volatile_("": : :"memory")
主要是保证程序的执行遵循顺序一致性。呵呵,有的时候你写代码的顺序,不一定是最终执行的顺序,这个是处
理器有关的