【环球新要闻】binfmt_misc

博客园   2023-06-14 21:28:58

一:binfmt_misc是什么

binfmt_misc是内核中的一个功能,它能将非本机的二进制文件与特定的解析器自动匹配起来,进行二进制解析。

例如,在x86上解析arm64架构的二进制。

通过binfmt_misc可以注册解析器来处理指定二进制文件格式的请求。这些解析器可以是本地可执行文件,也可以是跨平台(ARM、MIPS)可执行文件。


(相关资料图)

二:怎么使用binfmt_misc2.1.注册解析器 

注册解析器的目的是为了让Linux在执行特定格式的二进制时,能够识别并自动选择相应的解析器来处理。

1.挂载

首先需要挂载 binfmt_misc,并使用`mount`命令将`binfmt_misc`文件挂载到/proc/sys/fs/binfmt_misc/。

mount binfmt_misc -t binfmt_misc /proc/sys/fs/binfmt_misc

2.创建解析器配置文件

/proc/sys/fs/binfmt_misc/目录下,可以创建一个配置文件,命名为register,其中register是要注册的二进制文件格式的标识符。

3.注册

在解释器配置文件中,可以使用echo命令将相应的配置信息写入。这些配置信息指定了二进制文件格式的特征、解释器的路径以及其他相关参数。例如,对于 Windows 可执行文件的解释器配置,可以指定其魔术数字、解释器的路径等。

使用`echo`命令向`/proc/sys/fs/binfmt_misc/`目录中的特定文件写入配置信息,以注册特定的二进制文件格式和解释器。

注册格式::name:type:offset:magic:mask:interpreter:flags

#/usr/bin/qemu-arm64为解析器程序的路径#magic为\x7fELF\x01\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x02\x00\x28\x00#mask为\xff\xff\xff\xff\xff\xff\xff\x00\xff\xff\xff\xff\xff\xff\xff\xff\xfe\xff\xff\xff
echo ":arm:M::\x7fELF\x01\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x02\x00\x28\x00:\xff\xff\xff\xff\xff\xff\xff\x00\xff\xff\xff\xff\xff\xff\xff\xff\xfe\xff\xff\xff:/usr/bin/qemu-arm64-static:" > register

以下是这些字段的含义:

name:是一个标识符字符串。指定解析器的名称或标识。在这个例子中,解析器的名称为"arm";type:是识别类型。给予M魔法和E扩展。offset:是文件中 magic/mask 的偏移量,以字节计算。默认为 0:name:type::magic...。使用文件扩展名匹配时忽略。magic:是 binfmt_misc 匹配的字节序列。魔术字符串可能包含十六进制编码的字符,mask:是一个(可选,默认为所有 0xff)掩码。interpreter:是应该使用二进制文件作为第一个参数调用的程序(指定完整路径)flags:这些标志控制解析器的行为和操作方式。下面是一些常见的 flags 标志及其作用:O:覆盖(Override)标志。当多个解析器的匹配规则冲突时,使用具有此标志的解析器进行匹配和执行。E:可执行文件标志。指定解析器用于执行可执行文件的功能。F:开启自动刷新标志。当启用此标志时,每次访问 register 文件时都会重新加载解析器配置。C:关闭自动刷新标志。当关闭此标志时,解析器配置只在系统启动时加载一次,之后不会自动刷新。B:启用解析器的特权执行。这将允许使用具有特权的解析器执行文件。M:启用魔数验证标志。指定解析器在匹配时必须验证魔数。注意事项:offset+size(magic) 必须小于 128,解释器字符串不得超过 127 个字符2.2.解析器是如何自动匹配

在Linux中,内核通过魔术数字(Magic Nmuber)来识别特定的二进制文件格式。

具体的识别过程如下:

内核读取二进制文件的开头部分的字节序列,通常是文件的前几个字节。

内核将读取到的字节序列与已注册解释器的魔术数字进行比对。

如果找到与魔术数字匹配的解释器,则选择该解释器来处理该二进制文件。

如果没有找到匹配的解释器,内核将无法执行该二进制文件,并可能会返回错误。

2.3.怎么获取二进制的魔法数字

在 Linux 终端中,可以使用 hexdump -C 或xxd 等命令行工具来查看二进制文件的内容。这些工具会显示文件的十六进制表示,并可以帮助你找到文件开头部分的魔数。

案例如下:

2.4.子网掩码的作用

除了magic还有一个mask这个怎么理解?

mask的作用是屏蔽或过滤魔数中的某些位,将魔数与掩码进行与运算,如果不想匹配魔数某些位,则再mask中将对应位设置为0即可。

掩码的主要目的是允许对魔数进行更灵活的匹配。有时候,二进制文件的魔数中的某些位是可变的或不重要的,但其他位则必须匹配。通过定义一个掩码来屏蔽那些不重要的位,可以提高匹配的灵活性。

2.5.魔数和掩码的与运算

与运算规则如下:

如果魔数和掩码的对应位都为1,结果位为1。如果魔数和掩码的对应位有一个为0,结果位为0。

如果你想要通过按位与运算得到0表示不匹配,可以将掩码中需要匹配的位设置为1,不需要匹配的位设置为0。这样,在按位与运算时,如果魔数的对应位与掩码的对应位都为1,结果位为1,否则为0。如果按位与运算的结果为0,表示魔数与掩码不匹配。

示例1:最终的按位与运算结果与原始的魔数值相同,即没有发生变化。

示例2:最终的按位与运算结果后6位全部为0,则后6位不进行比较

2.6.与运算结果与注册表中魔数对比

1.取注册表魔数

使用 cat命令读取 /proc/sys/fs/binfmt_misc/目录下的相关文件。每个注册表都以文件的形式存在该目录中,文件名代表了对应的架构。例如,/proc/sys/fs/binfmt_misc/arm_64,表示 ARM 架构的注册表。

2.对比

案例1:如下图,因为与运算结果与注册表魔数相同,则可以调用到对应注册表中interpreter对应的解析器文件。

案例2:如下图,与运算结果的非0位与注册表魔数结果相同,则可以调用到对应注册表中interpreter对应的解析器文件。

推荐