learn-tech/专栏/计算机基础实战课/17RISC-V指令精讲(二):算术指令实现与调试.md
2024-10-16 10:18:29 +08:00

478 lines
22 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

因收到Google相关通知网站将会择期关闭。相关通知内容
17 RISC-V指令精讲算术指令实现与调试
你好我是LMOS。
上节课我们学习了算术指令中的加减指令和比较指令。不过一个CPU只能实现这两类指令还不够。如果你学过C语言应该对“<<、>>、&、|、!”这些运算符并不陌生这些运算符都需要CPU提供逻辑和移位指令才可以实现。
今天我们就继续学习逻辑指令and、or、xor和移位指令 sll、srl、sra。代码你可以从这里下载。话不多说我们开始吧。
逻辑指令
从CPU芯片电路角度来看其实CPU更擅长执行逻辑操作如与、或、异或。至于为什么你可以看看CPU的基础门电路。
RISC-V指令集中包含了三种逻辑指令这些指令又分为立即数版本和寄存器版本分别是andi、and、ori、or、xori、xor这六条指令。我们学习这些指令的方法和上节课类似也涉及到写代码验证调试的部分。
按位与操作andi、and指令
首先我们来学习一下andi、and指令它们的形式如下所示
andi rdrs1imm
#andi 立即数按位与指令
#rd 目标寄存器
#rs1 源寄存器1
#imm 立即数
and rdrs1rs2
#and 寄存器按位与指令
#rd 目标寄存器
#rs1 源寄存器1
#rs2 源寄存器2
上述代码中rd、rs1、rs2可以是任何通用寄存器imm是立即数。
andi、and这两个指令完成的操作我们用伪代码描述如下
//andi
rd = rs1 & imm
//and
rd = rs1 & rs2
按位与的操作就是把rs1与imm或者rs1与rs2其中的每个数据位两两相与。两个位都是1结果为1否则结果为0。
下面我们在工程目录下建立一个and.S文件写代码验证一下这两个指令如下所示
.globl andi_ins
andi_ins:
andi a0a00xff #a0 = a0&0xffa0是C语言调用者传递的参数a0也是返回值这样计算结果就返回了
jr ra #函数返回
.globl and_ins
and_ins:
and a0a0a1 #a0 = a0&a1a0、a1是C语言调用者传递的参数a0是返回值这样计算结果就返回了
jr ra #函数返回
这里我们已经写好了andi_ins与and_ins函数分别去执行andi和and指令。
andi指令是拿a0寄存器和立即数0xff进行与操作。由于立即数是0xff所以总是返回a0的低8位数据and指令则是拿a0和a1寄存器进行与操作再把结果写入到a0寄存器。
下面我们用VSCode打开工程按下“F5”调试一下如下所示
上图中是执行完andi a0a00xff指令之后执行jr ra指令之前的状态。可以看到a0寄存器中的值确实已经变成2了这说明运算的结果是符合预期的。
andi_ins函数返回后输出的结果如下图所示
因为2的二进制数据是0b00000000000000000000000000000010与上0xff的二进制数据是0b00000000000000000000000011111111结果确实是2所以返回2结果是正确的。
接下来我们对and_ins函数进行调试。
上图展示的是执行完and a0a0a1指令之后执行jr ra指令之前的状态。我们看到a0寄存器中的值已经变成了1这说明运算的结果是正确的。
and_ins函数返回后输出的结果如下图所示
上图中因为1的二进制数据是0b00000000000000000000000000000001与上1的二进制数据是0b00000000000000000000000000000001确实是1所以返回1结果完全正确。
按位或操作ori、or指令
按位与操作说完了我们接着来学习一下或指令ori、or它们的形式如下
ori rdrs1imm
#ori 立即数按位或指令
#rd 目标寄存器
#rs1 源寄存器1
#imm 立即数
or rdrs1rs2
#or 寄存器按位或指令
#rd 目标寄存器
#rs1 源寄存器1
#rs2 源寄存器2
同样地上述代码中rd、rs1、rs2可以是任何通用寄存器imm表示立即数。
我们还是从伪代码的描述入手看看ori、or完成的操作。
//ori
rd = rs1 | imm
//or
rd = rs1 | rs2
按位或的操作就是把rs1与imm或者rs1与rs2其中的每个数据位两两相或两个位有一位为1结果为1否则结果为0。
我们在and.S文件中写写代码做个验证如下所示
.globl ori_ins
ori_ins:
ori a0a00 #a0 = a0|0a0是C语言调用者传递的参数a0也是返回值这样计算结果就返回了
jr ra #函数返回
.globl or_ins
or_ins:
or a0a0a1 #a0 = a0|a1a0、a1是C语言调用者传递的参数a0是返回值这样计算结果就返回了
jr ra #函数返回
上述代码中ori_ins与or_ins函数分别执行了ori和or指令。
ori指令是拿a0寄存器和立即数0进行或操作由于立即数是0所以总是返回a0原本的数据or指令是拿a0和a1寄存器进行或操作再把结果写入到a0寄存器。
我们还是到VSCode里按下“F5”调试一下如下所示
上图中是执行完ori a0a00指令之后执行jr ra指令之前的状态。如果a0寄存器中的值确实已经变成0xf0f0了就说明运算的结果正确。
ori_ins函数返回后输出的结果如下图所示
因为0xf0f0的二进制数据是0b00000000000000001111000011110000或上0的二进制数据是0b00000000000000000000000000000000按位或操作是“有1为1”所以返回0xf0f0结果是正确的。
我们再用同样的方法调试一下or_ins函数如下图所示
上图展示的是执行完or a0a0a1指令之后执行jr ra指令之前的状态。如果我们看到a0寄存器中的值确实已经变成0x1111了就说明运算的结果正确符合预期。
or_ins函数返回后输出的结果如下
上图中or_ins函数第一个参数为0x1000的二进制数据是0b00000000000000000001000000000000第二个参数为0x1111的二进制数据是0b00000000000000000001000100010001两个参数相或而按位或操作是“有1为1”所以返回0x1111结果是正确的。
按位异或操作xori、xor指令
最后我们再说说逻辑指令中的最后两条指令xori、xor即异或指令的立即数版本和寄存器版本它们的形式如下所示
xori rdrs1imm
#xori 立即数按位异或指令
#rd 目标寄存器
#rs1 源寄存器1
#imm 立即数
xor rdrs1rs2
#xor 寄存器按位异或指令
#rd 目标寄存器
#rs1 源寄存器1
#rs2 源寄存器2
形式上和前面与操作、或操作差不多,就不过多重复了。
xori、xor完成的操作用伪代码描述如下
//xori
rd = rs1 ^ imm
//xor
rd = rs1 ^ rs2
按位异或的操作是把rs1与imm或者rs1与rs2其中的每个数据位两两相异或两个位如果不相同结果为1。如果两个位相同结果为0。
在and.S文件中写代码验证一下如下所示。
.globl xori_ins
xori_ins:
xori a0a00 #a0 = a0^0a0是C语言调用者传递的参数a0也是返回值这样计算结果就返回了
jr ra #函数返回
.globl xor_ins
xor_ins:
xor a0a0a1 #a0 = a0^a1a0、a1是C语言调用者传递的参数a0是返回值这样计算结果就返回了
jr ra #函数返回
我们已经写好了xori_ins与xor_ins函数分别是执行xori和xor指令。xori指令是拿a0寄存器和立即数0进行异或操作由于立即数是0而且各个数据位相同为0不同为1所以同样会返回a0原本的数据 而xor指令是拿a0和a1寄存器进行或操作再把结果写入到a0寄存器。
下面我们按下“F5”调试一下如下所示
上图中是执行完xori a0a00指令之后执行jr ra指令之前的状态我们已经看到a0寄存器中的值已经变成0xff了这说明运算的结果正确。
xori_ins函数返回后输出的结果如下图所示
结合上面这张截图不难发现我们传递给xori_ins函数的参数是0xff因为0xff的二进制数据是0b00000000000000000000000011111111异或上0的二进制数据是0b00000000000000000000000000000000按位异或操作是“相同为0不同为1”所以返回0xff结果是正确的。
我们再来调试一下xor_ins函数。xor a0a0a1指令执行完成之后执行jr ra指令之前的状态如图所示
我们看到a0寄存器中的值已经变成0了这说明运算的结果正确符合预期。
xor_ins函数返回后输出的结果如下图所示
由于我们给xor_ins函数传递了两个相同的参数都是0xffff。因为0xffff的二进制数据是0b00000000000000001111111111111111两者异或按位异或操作是“相同为0不同为1”所以返回0结果是正确的。
下面我们看一下andi、and、ori、or、xori、xor这六条指令的二进制数据。
我们打开工程目录下的and.bin文件如下所示
上述图中的12个32位数据是12条指令其中六个0x00008067数据是六个函数的返回指令。
具体的指令形式,还有对应的汇编语句,我用表格帮你做了整理。
同样地我带你拆分一下andi、and、ori、or、xori、xor指令的各位段的数据看看它们是如何编码的。
从上图中可以发现立即数版本和寄存器版本的and、or、xor指令通过操作码区分而它们之间的寄存器和立即数版本是靠功能位段来区分立即数位段和源寄存器与目标寄存器位段和之前的指令是相同的。
到这里六条逻辑指令已经拿下了,咱们继续学习移位指令。
移位指令
移位指令和逻辑操作指令一样都是CPU电路很容易就能实现的。
RISC-V指令集中的移位指令包括逻辑左移、逻辑右移和算术右移它们分别有立即数和寄存器版本所以一共有六条。逻辑右移和算术右移是不同的等我们后面用到时再专门讲解。
逻辑左移指令slli、sll指令
我们先看看逻辑左移指令也就是slli、sll指令它们的形式如下所示
slli rdrs1imm
#slli 立即数逻辑左移指令
#rd 目标寄存器
#rs1 源寄存器1
#imm 立即数rs1左移的位数0~31
sll rdrs1rs2
#sll 寄存器逻辑左移指令
#rd 目标寄存器
#rs1 源寄存器1
#rs2 源寄存器2rs1左移的位数
上述代码中rd、rs1、rs2可以是任何通用寄存器。imm是立即数其实在官方文档中这里是shamt表示rs1 左移 shamt 位。这里我为了和之前的形式保持一致才继续沿用了imm。
slli、sll它们俩完成的操作用伪代码描述如下
//slli
rd = rs1 << imm
//sll
rd = rs1 << rs2
逻辑左移的操作是把rs1中的数据向左移动imm位或者把rs1中的数据向左移动rs2位右边多出的空位填 0 并写入 rd
我们用图解来表达这一过程这样你就能一目了然了
接下来我们在工程目录下建立一个sll.S文件写代码验证一下如下所示
.globl slli_ins
slli_ins:
slli a0, a0, 4 #a0 = a0<<4a0是C语言调用者传递的参数a0也是返回值这样计算结果就返回了
jr ra #函数返回
.globl sll_ins
sll_ins:
sll a0, a0, a1 #a0 = a0<<a1a0、a1是C语言调用者传递的参数a0是返回值这样计算结果就返回了
jr ra #函数返回
这里已经写好了slli_ins与sll_ins函数它们会分别执行slli和sll指令立即数逻辑左移slli指令是把a0中的数据左移4位而逻辑左移sll指令是把a0中的数据左移左移多少位要取决于a1中的数据完成移动后再把结果写入到a0寄存器
我们还是用VSCode打开工程按下F5调试如下所示
上图中是进入slli_ins函数执行完slli a0a04指令之后执行jr ra指令之前的状态我们给slli_ins函数传进来的参数是0xffff现在对照图示就能看到a0寄存器中的值确实已经变成0xffff0了这说明运算结果是正确的
slli_ins函数返回后输出的结果如下
因为0xffff二进制数据是0b00000000000000001111111111111111逻辑左移4位后的结果是0xffff0它的二进制数据是0b00000000000011111111111111110000结果正确无误
下面我们接着对sll_ins函数进行调试如下所示
上图中是进入sll_ins函数执行完sll a0a0a1指令之后执行jr ra指令之前的状态我们给sll_ins函数传进来的参数是0xeeeeeeee和31a1寄存器)。如果看到a0寄存器中的值确实已经变成0了这说明运算结果是正确的
sll_ins函数返回后输出的结果如下图所示
第一个参数0xeeeeeeee的二进制数据是0b11101110111011101110111011101110逻辑左移31位后的结果是0因为它把所有的二进制数据位都移出去了然后空位补0所以结果正确无误
逻辑右移指令srlisrl
有逻辑左移就有逻辑右移逻辑右移指令srlisrl分别对应着立即数和寄存器版本它们的形式如下
srli rdrs1imm
#srli 立即数逻辑右移指令
#rd 目标寄存器
#rs1 源寄存器1
#imm 立即数rs1右移的位数0~31
srl rdrs1rs2
#srl 寄存器逻辑右移指令
#rd 目标寄存器
#rs1 源寄存器1
#rs2 源寄存器2rs1右移的位数
上述代码中rdrs1rs2可以是任何通用寄存器imm是立即数为了和之前的形式保持一致我们还是沿用imm而非官方文档中的shamt
srlisrl完成的操作可以用后面的伪代码来描述
//srli
rd = rs1 >> imm
//srl
rd = rs1 >> rs2
逻辑右移的操作是把rs1中的数据向右移动imm位。或者把rs1中的数据向右移动rs2位左边多出的空位填 0 并写入 rd 中。
你可以对照我画的图示来理解这一过程。
光看看格式自然不够我们在sll.S文件中写段代码来验证一下如下所示
.globl srli_ins
srli_ins:
srli a0, a0, 8 #a0 = a0>>8,a0是C语言调用者传递的参数a0也是返回值这样计算结果就返回了
jr ra #函数返回
.globl srl_ins
srl_ins:
srl a0, a0, a1 #a0 = a0>>a1,a0、a1是C语言调用者传递的参数a0是返回值这样计算结果就返回了
jr ra #函数返回
逻辑右移的两个函数srli_ins与srl_ins我已经帮你写好了。代码中立即数逻辑右移srli指令是把a0中的数据右移8位。逻辑右移srl指令则是把a0中的数据右移右移多少位要看a1中数据表示的位数是多少再把结果写入到a0寄存器。-
两条右移指令做了哪些事儿咱们说完了老规矩打开工程按下“F5”就可以调试了效果如图
上图中是进入srli_ins函数执行完srli a0a08指令之后执行jr ra指令之前的状态我们给srli_ins函数传进来的参数是0xffff。现在对照截图可以看到a0寄存器中的值确实已经变成0xff了这说明运算结果正确。
srli_ins函数返回后输出的结果如下图所示
因为调用函数srli_ins的参数0xffff的二进制数据是0b00000000000000001111111111111111逻辑右移8位后的结果是0xff它的二进制数据是0b00000000000000000000000011111111结果正确符合我们的预期。
拿下了srli_ins函数接下来就是srl_ins函数的调试如下所示
上图中是调用进入srl_ins函数执行完srl a0a0a1指令之后执行jr ra指令之前的状态给srl_ins函数传进来的参数是0xaaaaaaaa。可以看到a0寄存器中的值确实已经变成0xaaaa了所以运算结果也是正确的。
srl_ins函数返回后输出的结果如下图所示
给srl_ins函数传进来的第一个参数是0xaaaaaaaa的二进制数据是0b10101010101010101010101010101010逻辑右移16位后的结果是0xaaaa其二进制数据为0b00000000000000001010101010101010 因为它把低16位二进制数据位移出去了然后高16位的空位补0所以结果正确无误。
算术右移指令srai、sra
最后还有两个算术右移指令它们和逻辑右移的最大区别是数据在逻辑右移之后左边多出空位用0填充而数据在算术右移之后左边多出的空位是用数据的符号位填充。如果数据的符号位为1就填充1如果为0就填充0。
它们的形式和伪代码与逻辑右移是一样的只不过指令助记符由srli、srl变成了srai、sra。
下面我们直接在sll.S文件中写代码进行验证。
.globl srai_ins
srai_ins:
srai a0, a0, 8 #a0 = a0>>8,a0是C语言调用者传递的参数a0也是返回值这样计算结果就返回了
jr ra #函数返回
.globl sra_ins
sra_ins:
sra a0, a0, a1 #a0 = a0>>a1,a0、a1是C语言调用者传递的参数a0是返回值这样计算结果就返回了
jr ra #函数返回
上述代码中的两个函数srai_ins与sra_ins可以实现算术右移。先看立即数算术右移srai指令它把a0中的数据右移了8位。而算术右移srl指令是把a0中的数据右移右移多少位由a1中的数据表示的位数来决定之后再把结果写入到a0寄存器。
我们按下“F5”调试的结果如下
上图中是进入立即数算术右移函数srai_ins执行完srai a0a08指令之后执行jr ra指令之前的状态。对照图里红框的内容可以看到给srai_ins函数传进来的参数是0x1111。如果a0寄存器中的值确实已经变成0x11了就代表运算结果正确。
srai_ins函数返回后输出的结果如下
因为我们给立即数算术右移函数srai_ins的参数0x1111其二进制数据是0b00000000000000000001000100010001符号位为0所以算术右移8位后的结果是0x11它的二进制数据是0b00000000000000000000000000010001结果非常正确。
我们接着调试一下sra_ins函数如下所示
上图中是进入算术右移函数sra_ins执行完sra a0a0a1指令之后执行jr ra指令之前的状态。对照图里左侧红框的部分我们就能知道sra_ins函数传进来的参数是0xaaaaaaaa你可能判断a0寄存器里输出的结果应该是0x0000aaaa但调试显示的实际结果却是0xffffaaaa。
出现这个结果你很奇怪是不是但这恰恰说明运算结果是正确的。我们先看看sra_ins函数返回后输出的结果是什么然后再分析原因。
因为我们给算术右移函数sra_ins的参数是0xaaaaaaaa和16这表明对0xaaaaaaaa算术右移160xaaaaaaaa的二进制数据是0b10101010101010101010101010101010注意其符号位为1所以算术右移16位后的结果是0xffffaaaa它的二进制数据是0b11111111111111111010101010101010结果是符合预期的。输出的结果也证实了这一点。
下面我们还是要看一下slli、sll、srli、srl、srai、sra这六条指令的二进制数据我们打开工程目录下的sll.bin文件。
可以看出图中的12个32位数据是12条指令其中六个0x00008067数据是六个函数的返回指令。具体的指令形式还有对应的汇编语句你可以参考后面的表格。
我们拆分一下slli、sll、srli、srl、srai、sra指令的各位段的数据看看它们是在内存中如何编码的你可以结合示意图来理解。
我虽然给你详细展示了这些指令如何编码,但并不需要你把细节全部硬记下来,重点是观察其中的规律。
从上图中我们可以发现sll、srl、sra指令的立即数版本和寄存器版本要通过操作码区分而它们之间是靠功能位段来区分的源寄存器与目标寄存器所在的位段和之前的指令是相同的。需要注意的是这些立即数版本的立即数位段在官方文档中叫shamt位段并且只占5位而其它指令的立即数占12位这里为了一致性还是沿用立即数。
到这里,六条移位指令我们就讲完了。
重点回顾
今天我们学习了逻辑指令和移位指令。
逻辑操作的指令包括andi、ori、or、xori、xor分别能对寄存器与寄存器、寄存器与立即数进行与、或、异或操作。有了这些操作CPU才能对数据进行逻辑运算在一些情况下还能提升CPU的执行性能。更多的应用后面课程里我们还会继续学习。
数据移位指令包括slli、sll、srli、srl、srai、sra也能分别能对寄存器与寄存器、寄存器与立即数进行逻辑左移、逻辑右移、算术右移操作。这些指令与逻辑指令一起执行数据的位运算时相当有用在特定情况下能代替乘除法指令。
经过漫长的学习我们用两节课程的篇幅一鼓作气学习了RISC-V全部的算术指令分为加减、比较、逻辑、移位四大类别一共有19条指令。这些指令作用于数据的运算在应用程序中扮演着重要角色。
但是CPU有了这些算术指令就够了吗这显然是不行的起码还需要流程控制指令和数据加载储存指令我们会在后续课程中继续讨论。
思考题
为什么指令编码中目标寄存器源寄存器1源寄存器2占用的位宽都是5位呢
欢迎你在留言区记录自己的疑问或收获,参与越多,你对内容的理解也更深入。如果觉得这节课内容不错,别忘了分享给更多朋友。