Pages
- 物理页是内核管理内存的基本单元。
- <linux/mm_type.h> struct page 表示一个物理page
struct page {
unsigned long flags;
atomic_t _count;
atomic_t _mapcount;
unsigned long private;
struct address_space *mapping;
pgoff_t index;
struct list_head lru;
void *virtual;
}
- flags
<linux/page-flags.h>里定义,标示是否dirty, locked in memory等 - _count
引用计数。一个page可能被page cache使用(mapping字段指向跟这个page关联的 address_space), 也可能被一个进程使用(page table 虚内存mapping到物理内存)。 - virtual
这个page的虚拟地址。high memory可能为null
注意page表示物理内存, 每个物理内存页对应一个,内核需要知道这个page是空闲的还是page cache在使用等。
Zones
因为硬件的限制,内核不能等同对待所有物理页。内核把pages分成zones。特别的有这两种硬件跟内存访问相关:
- 一些硬件可以DMA(direct memory access)固定内存地址
- 一些体系可以物理寻址的内存比虚拟内存多(什么情况?)。所以一些内存没有被永久的映射到内核地址空间。
Linux有4种主要的内存zones:
- ZONE_DMA
- ZONE_DMA32
与上类似,只被32位设备访问 - ZONE_NORMAL
normal, regularly mapped, pages - ZONE_HIGHMEM
This zone contains “high memory,” which are pages not perma-
nently mapped into the kernel’s address space.
实际内存的zones布局是跟体系相关的。比如有的体系设备可以直接访问0~16M,那这部位就做为ZONE_DMA。x86-64没有ZONE_HIGHMEM。
Getting Pages
kmalloc()
类似用户空间的malloc(), 内核分配byte-sized chunks。
在<linux/slab.h>里申明
void * kmalloc(size_t size, gfp_t flags)
分配的是物理连续的,返回起始地址。
使用实例:
struct dog *p;
p = kmalloc(sizeof(struct dog), GFP_KERNEL);
if (!p)
/* handle error ... */
gfp_mask Flags
有Action Modifiers, Zones Modifiers, Type Flags组成
ptr = kmalloc(size, __GFP_WAIT | __GFP_IO | __GFP_FS);
kfree()
与kmalloc()相反
vmalloc()
分配的连续的虚拟内存
Slab Layer
管理分配相同大小对象的。
Statically Allocating on the Stack
内核态的栈大小是固定的,每个进程2个page大小。每个进程都有用户态的栈跟内核态的栈。
Per-CPU Allocations
一般数据对应一个cpu个数大小的数据,每个对应一个cpu,注意这样不需要加锁,只需要访问的时候禁掉抢占。为什么需要禁掉抢占,想下如果获取这个变量准备做修改,这是后抢占跑了另外一个进程,这个进程也获取修改这个变量就有问题了(虽然都是跑的同一个cpu), 重新调度后本身这个进程也可能跑在了另一个cpu了。禁掉抢占的开销比加锁的开销小得多。
- 避免锁
- reduce cache invalidation