学无止境,一直在做内核开发,却从来没有仔细想过这个过程。因为所有的程序都有个编译,链接的过程。
在linux内核模块中,我们可以使用很多内核export出的函数,来实现我们的功能,作为内核附属功能的扩展。但是这些export出来的函数在hook的时候是远远不够用的,所以我们往往还要获取一些没有export出来的函数。
使用这些没有export出来的函数就要我们清楚的知道内核模块是如何link的,也就是如何寻找符号的。
kallsyms_lookup_name
首先来谈下这个函数,我们往往发现kallsyms_lookup_name能找到很多没有导出的符号。它的原理和insmod插入时的寻找符号是不一样的,它取决于一个config(CONFIG_KALLSYMS),开启了这个开关就会从一个数组中找到很多符号。这个开关一个是给/proc/kallsysms用,还有一个是当kernel panic的时候,打出stack tree。所以kallsyms_lookup_name只有代码段的符号(导出和没有导出的都有),这样会导致一个初始化的全局变量的符号是通过kallsyms_lookup_name找不到的。
内核模块中符号的链接过程
内核模块载入后,解析模块中符号的函数在kernel/module.c::find_symbol->each_symbol。
- 第一步会从一个叫做ksymtab的段中找符号。
- 如果没有找到就会去遍历所有的内核模块,看有没有导出的符号。
如果都没有找到,就会报找不到函数的错误。
口说无凭,看代码:
//寻找符号的入口函数
const struct kernel_symbol *find_symbol(const char *name,
struct module **owner,
const unsigned long **crc,
bool gplok,
bool warn)
{
struct find_symbol_arg fsa;
fsa.name = name;
fsa.gplok = gplok;
fsa.warn = warn;
if (each_symbol_section(find_symbol_in_section, &fsa)) {
if (owner)
*owner = fsa.owner;
if (crc)
*crc = fsa.crc;
return fsa.sym;
}
pr_debug("Failed to find symbol %s\n", name);
return NULL;
}
EXPORT_SYMBOL_GPL(find_symbol);
在这个函数中首先会从ksymtab段中去寻找,这个段中是在编译期间,就会把kernel export出来的函数填充在vmlinux的这个段中的。
bool each_symbol_section(bool (*fn)(const struct symsearch *arr,
struct module *owner,
void *data),
void *data)
{
struct module *mod;
static const struct symsearch arr[] = {
{ __start___ksymtab, __stop___ksymtab, __start___kcrctab,
NOT_GPL_ONLY, false },
{ __start___ksymtab_gpl, __stop___ksymtab_gpl,
__start___kcrctab_gpl,
GPL_ONLY, false },
{ __start___ksymtab_gpl_future, __stop___ksymtab_gpl_future,
__start___kcrctab_gpl_future,
WILL_BE_GPL_ONLY, false },
#ifdef CONFIG_UNUSED_SYMBOLS
{ __start___ksymtab_unused, __stop___ksymtab_unused,
__start___kcrctab_unused,
NOT_GPL_ONLY, true },
{ __start___ksymtab_unused_gpl, __stop___ksymtab_unused_gpl,
__start___kcrctab_unused_gpl,
GPL_ONLY, true },
#endif
};
//在上面的ksymtab段中找地址,是个数组,找到了就返回
if (each_symbol_in_section(arr, ARRAY_SIZE(arr), NULL, fn, data))
return true;
//没找到就会遍历所有的内核模块,找export出来的符号
list_for_each_entry_rcu(mod, &modules, list) {
struct symsearch arr[] = {
{ mod->syms, mod->syms + mod->num_syms, mod->crcs,
NOT_GPL_ONLY, false },
{ mod->gpl_syms, mod->gpl_syms + mod->num_gpl_syms,
mod->gpl_crcs,
GPL_ONLY, false },
{ mod->gpl_future_syms,
mod->gpl_future_syms + mod->num_gpl_future_syms,
mod->gpl_future_crcs,
WILL_BE_GPL_ONLY, false },
#ifdef CONFIG_UNUSED_SYMBOLS
{ mod->unused_syms,
mod->unused_syms + mod->num_unused_syms,
mod->unused_crcs,
NOT_GPL_ONLY, true },
{ mod->unused_gpl_syms,
mod->unused_gpl_syms + mod->num_unused_gpl_syms,
mod->unused_gpl_crcs,
GPL_ONLY, true },
#endif
};
if (each_symbol_in_section(arr, ARRAY_SIZE(arr), mod, fn, data))
return true;
}
return false;
}
EXPORT_SYMBOL_GPL(each_symbol_section);
注意:不管在内核模块还是ksymtab段中,都必须是export的符号才能找到。对于找不到的符号要使用system.map或者vmlinux找到,然后将对应的符号替换为地址。