關于ARM的一些基本概念,大家可以參考我之前的文章:
《嵌入式工程師到底要不要學習ARM彙編指令?》
《到底什麼是Cortex、ARMv8、arm架構、ARM指令集、soc?一文幫你梳理基礎概念【科普】》
關于ARM指令用到的IDE開發環境可以參考下面這篇文章
《1. 從0開始學ARM-安裝Keil MDK uVision集成開發環境》
《2. 從0開始學ARM-CPU原理,基于ARM的SOC講解》
《3. 從0開始學ARM-ARM模式、寄存器、流水線》
有了計算機硬件架構的原理,下面我就可以學習ARM模式、寄存器、流水線等基礎知識。
學習ARM,就必須要學習ARM指令,ARM指令是CPU提供給我們的接口,是我們打開CPU這個潘多拉魔盒的鑰匙。
ARM指令有很多,為了讓大家能快速上手,一口君整理了一些對我們最有幫助的指令。keil軟件的操作,可以參考第一章。
讓我們開始吧!
0.指令分類語法:
MOV{條件}{S}目的寄存器,源操作數
功能: MOV指令完成從另一個寄存器、被移位的寄存器或将一個立即數加載到目的寄存器。其中S選項決定指令的操作是否影響CPSR中條件标志位的值,當沒有S時指令不更新CPSR中條件标志位的值。
指令示例:
MOVr0,#0x1;将立即數0x1傳送到寄存器R0
MOVR1,R0;将寄存器R0的值傳送到寄存器R1
MOVPC,R14;将寄存器R14的值傳送到PC,常用于子程序返回
MOVR1,R0,LSL#3;将寄存器R0的值左移3位後傳送到R1
【注:不區分大小寫】
思考,為什麼以下賦值出錯?
MOVR0,#0xfff
要想搞懂這個問題,我們需要了解什麼是立即數。
2. 什麼是立即數?立即數是由 0-255之間的數據循環右移偶數位生成。
判斷規則如下:
而例子中的數是0xfff,我們來看下他的二進制:
00000000000000000000111111111111
按照上述規則,我們最終操作結果如下:
111111111111
可以看到剩餘的位數大于8個,所以該數不是立即數。 為什麼立即數會有這麼個限定? 我們需要從MOV這條指令的機器碼來說起。
3. MOV機器碼讓我們執行下面代碼:
AREAExample,CODE,READONLY;聲明代碼段Example
ENTRY;程序入口
Start
//測試代碼,添加在以下位置即可,後面不再貼完整代碼
movr1,#0x80000001
OVER
END
然後點擊debug按鈕,查看對應的機器碼:
得到mov r1,#0x80000001指令的機器碼是「E3A01106」
我們來分析這個機器碼。
MOV機器指令格式
用ARM指令助記符表示為:
<opcode>{<cond>}{S}<Rd>,<Rn>,<shift_op2>
每個域的含義如下:
1) {<cond>}:條件碼域指令允許執行的條件編碼。花括号表示此項可缺省。
ARM指令的一個重要特點是可以條件執行,每條ARM指令的條件碼域包含4位條件碼,共16種。幾乎所有指令均根據CPSR中條件碼的狀态和指令條件碼域的設置有條件的執行。當指令執行條件滿足時,指令被執行,否則被忽略。指令條件碼及其助記符後綴表示參見下表。
每種條件碼可用兩個字符表示,這兩個字符可以作為後綴添加在指令助記符的後面和指令同時使用。
例如: 跳轉指令B可以加上後綴EQ變為BEQ,表示“相等則跳轉”,即當CPSR中的Z标志置位時發生跳轉。
2) <opcode>:操作碼域指令編碼的助記符;
3) {S} :條件碼設置域這是一個可選項,當在指令中設置{S}域時,指令執行的結果将會影響程序狀态寄存器CPSR中相應的狀态标志。 例如:
ADDR0,R1,R2;R1與R2的和存放到R0寄存器中,不影響狀态寄存器
ADDSR0,R1,R2;執行加法的同時影響狀态寄存器
指令中比較特殊的是「CMP指令,它不需要加S後綴就默認地根據計算結構更改程序狀态寄存器」。
4) <Rd>:目的操作數ARM指令中的目的操作數總是一個寄存器。 如果與第一操作數寄存器相同,也必須要指明,不能缺省。
5) <Rn>:第一操作數ARM指令中的第一操作數也必須是個寄存器。
6) <shift_op2>:第二操作數在第二操作數中可以是寄存器、内存存儲單元或者立即數。
如果是立即數:
bit:[11-8]表示操作數向左移動的位數/2,
bit:[7-0]表示最終的操作數
根據MOV指令格式,我們分析各個位域的值:
bite 含義 1110 Cond忽略 00 1 1101 opcode 0 s 命令不含S 0000 rn,沒有源寄存器為0 0001 rd 目的寄存器R0 0001 shifter 0000 0110 操作數
立即數0x80000001二進制為:
10000000000000000000000000000001
循環左移「2」位後得到以下結果:
00000000000000000000000000000110
所以shifter的值為2/2=1,操作數的值為0000 0110。
二、移位操作ARM微處理器支持數據的移位操作,移位操作在ARM指令集中不作為單獨的指令使用,它隻能作為指令格式中是一個字段,在彙編語言中表示為指令中的選項。移位操作包括如下6種類型,ASL和LSL是等價的,可以自由互換:
1) LSL(或ASL)邏輯(算術)左移尋址格式:
通用寄存器,LSL(或ASL)操作數
完成對通用寄存器中的内容進行邏輯(或算術)的左移操作,按操作數所指定的數量向左移位,「低位用零來填充」。其中,操作數可以是通用寄存器,也可以是立即數(0~31)。 如:
MOVR0,R1,LSL#2;将R1中的内容左移兩位後傳送到R0中。
尋址格式:
通用寄存器,LSR操作數
完成對通用寄存器中的内容進行右移的操作,按操作數所指定的數量向右移位,「左端用零來填充」。其中,操作數可以是通用寄存器,也可以是立即數(0~31)。 如:
MOVR0,R1,LSR#2;将R1中的内容右移兩位後傳送到R0中,左端用零來填充。
尋址格式:
通用寄存器,ASR操作數
完成對通用寄存器中的内容進行右移的操作,按操作數所指定的數量向右移位,「左端用第31位的值來填充」。其中,操作數可以是通用寄存器,也可以是立即數(0~31)。 如:
MOVR0,R1,ASR#2;将R1中的内容右移兩位後傳送到R0中,左端用第31位的值來填充。
尋址格式:
通用寄存器,ROR操作數
完成對通用寄存器中的内容進行循環右移的操作,按操作數所指定的數量向右循環移位,「左端用右端移出的位來填充」。其中,操作數可以是通用寄存器,也可以是立即數(0~31)。顯然,當進行32位的循環右移操作時,通用寄存器中的值不改變。 如:
MOVR0,R1,ROR#2;将R1中的内容循環右移兩位後傳送到R0中。
尋址格式:
通用寄存器,RRX操作數
完成對通用寄存器中的内容進行帶擴展的循環右移的操作,按操作數所指定的數量向右循環移位,「左端用進位标志位C來填充」。其中,操作數可以是通用寄存器,也可以是立即數(0~31)。 如:
MOVR0,R1,RRX#2;将R1中的内容進行帶擴展的循環右移兩位後傳送到R0中。
;第二操作數寄存器移位操作,5種移位方式,9種語法
;邏輯左移
movr0,#0x1
movr1,r0,lsl#1;移位位數1-31肯定合法
movr0,#0x2
movr1,r0,lsr#1;邏輯右移
movr0,#0xffffffff
movr1,r0,asr#1;算術右移符号位不變,次高位補符号位
movr0,#0x7fffffff
movr1,r0,asr#1
movr0,#0x7fffffff
movr1,r0,ror#1;循環右移
movr0,#0xffffffff
movr1,r0,rrx;唯一不需要指定循環位數的移位方式
;帶擴展的循環右移
;C标志位進入最高位,最低位進入C标志位
;移位值可以是另一個寄存器的值低5bit,寫法如下
movr2,#1
movr0,#0x1
movr1,r0,lslr2;移位位數1-31肯定合法
movr0,#0xffffffff
movr1,r0,asrr2;算術右移符号位不變,次高位補符号位
movr0,#0x7fffffff
movr1,r0,asrr2
movr0,#0x7fffffff
movr1,r0,rorr2;循環右移
上述結果不再截圖,讀者可以自行拷貝到keil中進行debug,查看寄存器中值以及符号位的變化。
三、CMP比較指令語法
CMP{條件}操作數1,操作數2
CMP指令用于把一個寄存器的内容和另一個寄存器的内容或立即數進行比較,同時更新CPSR中條件标志位的值。該指令進行一次減法運算,「但不存儲結果,隻更改條件标志位」。cmp是做一次減法,并不保存結果,僅僅用來産生一個邏輯,體現在改變cpsr相應的condition位。
标志位表示的是操作數1與操作數2的關系(大、小、相等), 指令示例:
CMPR1,R0;将寄存器R1的值與寄存器R0的值相減,并根據結果設置CPSR的标志位
CMPR1,#100;将寄存器R1的值與立即數100相減,并根據結果設置CPSR的标志位
語法
TST{條件}操作數1,操作數2
TST指令用于把一個寄存器的内容和另一個寄存器的内容或立即數進行按位的與運算,并根據運算結果更新CPSR中條件标志位的值。操作數1是要測試的數據,而操作數2是一個位掩碼,根據測試結果設置相應标志位。當位與結果為0時,EQ位被設置。 指令示例
TSTR1,#%1;用于測試在寄存器R1中是否設置了最低位(%表示二進制數)。
例1:找出三個寄存器中數據最大的數
movr0,#3
movr1,#4
movr2,#5
cmpr1,r0
movgtr0,r1
cmpr2,r0
movgtr0,r2
例2:求兩個數的差的絕對值
movr0,#9
movr1,#15
cmpr0,r1
beqstop
subgtr0,r0,r1
subltr1,r1,r0
帶條件碼的指令執行請參考本篇表格《指令的條件碼》
五、數據的處理指令ADD
ADD{條件}{S}目的寄存器,操作數1,操作數2
ADD指令用于把兩個操作數相加,并将結果存放到目的寄存器中。 操作數1應是一個寄存器,操作數2可以是一個寄存器,被移位的寄存器,或一個立即數。 指令示例:
ADDR0,R1,R2;R0=R1 R2
ADDR0,R1,#256;R0=R1 256
ADDR0,R2,R3,LSL#1;R0=R2 (R3<<1)
注意這個指令不是射手。。。。
除了正常做加法運算之外,還要加上CPSR中的C條件标志位,如果要影響CPSR中對應位,加後綴S。
SUBSUB指令的格式為:
SUB{條件}{S}目的寄存器,操作數1,操作數2
SUB指令用于把操作數1減去操作數2,并将結果存放到目的寄存器中。操作數1應是一個寄存器,操作數2可以是一個寄存器,被移位的寄存器,或一個立即數。該指令可用于有符号數或無符号數的減法運算。
如:
SUBR0,R1,R2;R0=R1-R2
SUBR0,R1,#256;R0=R1-256
SUBR0,R2,R3,LSL#1;R0=R2-(R3<<1)
除了正常做加法運算之外,還要再減去CPSR中C條件标志位的反碼 根據執行結果設置CPSR對應的标志位 AND指令的格式為:
AND{條件}{S}目的寄存器,操作數1,操作數2
AND指令用于在兩個操作數上進行邏輯與運算,并把結果放置到目的寄存器中。操作數1應是一個寄存器,操作數2可以是一個寄存器,被移位的寄存器,或一個立即數。該指令常用于屏蔽操作數1的某些位。 如:
ANDR0,R0,#3;該指令保持R0的0、1位,其餘位清零。
ORR指令的格式為:
ORR{條件}{S}目的寄存器,操作數1,操作數2
ORR指令用于在兩個操作數上進行邏輯或運算,并把結果放置到目的寄存器中。操作數1應是一個寄存器,操作數2可以是一個寄存器,被移位的寄存器,或一個立即數。該指令常用于設置操作數1的某些位。 如:
ORRR0,R0,#3;該指令設置R0的0、1位,其餘位保持不變。
這是一個非常實用的指令,在實際寄存器操作經常要将某些位清零,但是又不想影響其他位的值,就可以使用該命令。
BIC指令的格式為:
BIC{條件}{S}目的寄存器,操作數1,操作數2
BIC指令用于清除操作數1的某些位,并把結果放置到目的寄存器中。
操作數1應是一個寄存器,操作數2可以是一個寄存器,被移位的寄存器,或一個立即數。操作數2為32位的掩碼,如果在掩碼中設置了某一位,則清除這一位。未設置的掩碼位保持不變。
如:
BICR0,R0,#%1011;該指令清除R0中的位0、1、和3,其餘的位保持不變。
movr0,#1
movr1,#2
addr2,r0,r1;r2=r0 r1
addr2,r0,#4
addr2,r0,r1,lsl#2;r2=r0+R1<<2;(R0+R1*4)
;2.adc64位加法r0,r1=r0,r1 r2,r3
movr0,#0
movr1,#0xffffffff
movr2,#0
movr3,#0x1
addsr1,r1,r3;r1=r1 r3必須加S後綴
adcr0,r0,r2;r0=r0 r2 c;add帶擴展的加法
可以對比下add和adds,沒有加s的話是不會影響條件位的。
;3.subrd=rn-op2
movr0,#1
subr0,r0,#1;r0=r0-1
;4.sbc64位減法r0,r1=r0,r1-r2,r3
;cpsrc對于加法運算C=1則代表有進位,C=0無進位
;對于減法運算C=1則代表無借位,C=0有借位
movr0,#0
movr1,#0x0
movr2,#0
movr3,#0x1
subsr1,r1,r3
sbcr0,r0,r2;sbc帶擴展的減法
;5.bic位清除
movr0,#0xffffffff
bicr0,r0,#0xff;andr0,r0,#0xffffff00
執行結果
六、跳轉指令
跳轉指令用于實現程序流程的跳轉,在ARM程序中有兩種方法可以實現程序流程的跳轉:
使用以下指令,可以保存将來的返回地址值,從而實現在4GB連續的線性地址空間的子程序調用。
MOVLR,PC
ARM指令集中的跳轉指令可以完成從當前指令「向前或向後的32MB的地址空間」的跳轉,包括以下4條指令:
B跳轉指令
BL帶返回的跳轉指令
BLX帶返回和狀态切換的跳轉指令thumb指令
BX帶狀态切換的跳轉指令thumb指令
指令的格式為:
MOV{條件}{S}目的寄存器,源操作數
B指令是最簡單的跳轉指令。一旦遇到一個 B 指令,ARM 處理器将立即跳轉到給定的目标地址,從那裡繼續執行。
Blabel程序無條件跳轉到标号label處執行
CMPR1,#0
BEQlabel當CPSR寄存器中的Z條件碼置位時,程序跳轉到标号Label處執行。
BL 指令的格式為:
MOVr0,#0x1;将立即數0x1傳送到寄存器R0
MOVR1,R0;将寄存器R0的值傳送到寄存器R1
MOVPC,R14;将寄存器R14的值傳送到PC,常用于子程序返回
MOVR1,R0,LSL#3;将寄存器R0的值左移3位後傳送到R1
BL是另一個跳轉指令,但跳轉之前,會在寄存器R14中保存PC當前值,因此,可以通過将R14 的内容重新加載到PC中,再返回到跳轉指令之後的那個指令處執行。該指令是實現子程序調用的一個基本但常用的手段。
BLlabel當程序無條件跳轉到标号Label處執行時,同時将當前的PC值保存到R14中
子函數要返回執行以下指令即可:
MOVR0,#0xfff
語法:
Branch:B{<cond>}label
BranchwithLink:BL{<cond>}subroutine_label
BL機器碼格式如下:
各域含義:
域 含義 cond 條件碼 101 操作碼 L 命令是否包含L offset 指令跳轉偏移量
其中offset是24個bite,最高位包含一個符号位,1個單位表示偏移一條指令,所以可以尋址±2^23^條指令,即±8M條指令。
而一條指令是4個字節,所以最大尋址空間為「±32MB的地址空間」。
我們來看下以下代碼:
AREAExample,CODE,READONLY
ENTRY;程序入口
Start
MOVR0,#0
MOVR1,#10
BLADD_SUM
BOVER
ADD_SUM
ADDR0,R0,R1
MOVPC,LR
OVER
END
由上圖所示:
根據BL的機器碼我們可以得到offset的值是0x000000,也就是說該指令跳轉本身,而根據我們的分析第6行代碼,應該是向前跳轉2條指令,按道理offset是應該是2,為什麼是0呢?
因為是3級流水線,所以pc存儲指令地址與正在處理指令地址之間相差8個字節,pc的地址是預取指令地址,而不是正在執行的指令的地址。
4. 如何訪問全部32-bit地址空間?可以手動設置LR寄存器,然後裝載到PC中。
MOVlr,pc
LDRpc,=dest
在編譯項目過程中,ARM連接器(linker)會自動為長跳轉(超過32Mb範圍)。
ldr下一章會詳細詳細講解。
舉例子函數多重嵌套調用,如何從子函數返回?
areafirst,code,readonly
code32
entry
main
;bl指令,子函數調用
movr0,#1
blchild_func
movr0,#2
stop
bstop
child_func
movr1,r0
movr2,lr
movr0,#3;<===pc
blchild_func_2
movr0,#4
movr0,r1
movlr,r2
movpc,lr
child_func_2;葉子函數
movr3,r0
movr4,lr;保存直接父函數用到的所有寄存器
movr0,#5
movr0,r3
movlr,r4;返回到直接父函數之前,把它用到的所有寄存器内容恢複
movpc,lr
end
由上述例子所示,每調用一級子函數,我們都把返回地址存入到未分組寄存器中,但是未分組寄存器畢竟是有限的,像Linux内核函數的調用層次往往很深,通用寄存器根本不夠用,要想保存返回地址,就需要對數據進行壓棧,那我們就要為每個模式的棧設置空間,那如何設置棧空間呢?下一篇我們繼續讨論。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!