【ARM Linux 内存管理入门及渐进 3 - CMA】

文章目录

- - 1.1.1 历史背景
  - 1.1.2 device tree reserved memory node
  - 1.1.3 CMA 结构描述符
  - 1.1.4 配置CMA内存
  - 1.1.5 reusable 属性
  - 1.1.6 per device CMA
  - 1.1.7 cmdline cma
  - 1.1.8 memblock 与 CMA的关系
- 1.2 CMA 工作流程
- - 1.2.1 准备知识
  - 1.2.2 初始化 CMA area

1.1.1 历史背景

历史背景

1.1.2 device tree reserved memory node

一开始，CMA area 的概念是全局的，通过内核配置参数和命令行参数，内核可以定位到 Global CMA area 在内存中的起始地址和大小（这里的Global的意思是针对所有的driver而言的）。并在初始化的时候，调用

dma_contiguous_reserve

函数，将指定的 memory region 保留给 Global CMA area 使用。

人性是贪婪的，驱动亦然，很快，有些驱动想吃独食，不愿意和其他驱动共享CMA，因此出现两种 CMA area：

Global CMA area给大家共享，
per device CMA 可以给指定的一个或者几个驱动使用。

这时候，命令行参数不是那么合适了，因此引入了 device tree 中的 r

eserved memory

node 的概念。当然，为了兼容，内核仍然支持CMA的 command line 参数。

1.1.3 CMA 结构描述符

在CMA模块中，

struct cma

数据结构用来抽象一个CMA area，具体定义如下：

struct cma { 
    unsigned long   base_pfn; 
    unsigned long   count; 
    unsigned long   *bitmap; 
    /* Order of pages represented by one bit */ 
    unsigned int order_per_bit; 
    struct mutex    lock; 
};

cma 模块使用 bitmap来管理其内存的分配，0表示free，1表示已经分配。具体内存管理的单位和struct cma中的order_per_bit成员相关:

如果 order_per_bit 等于0，表示按照一个一个page来分配和释放，

如果 order_per_bit等于 1，表示按照2个page组成的block来分配和释放，以此类推。

struct cma 中的bitmap成员就是管理该cma area内存的bit map。

count 成员说明了该cma area内存有多少个page。它和order_per_bit一起决定了bitmap指针指向内存的大小。

base_pfn 定义了该CMA area的起始 page frame number，base_pfn和count一起定义了该CMA area在内存在的位置。

我们前面说过了，CMA模块需要管理若干个CMA area，有gloal的，有per device的，代码如下：

每一个

struct cma

抽象了一个CMA area，标识了一个物理地址连续的memory area。

调用

cma_alloc

分配的连续内存就是从CMA area中获得的。

具体有多少个CMA area是编译时决定了，而具体要配置多少个CMA area是和系统设计相关，你可以为特定的驱动准备一个CMA area，也可以只建立一个通用的CMA area，供多个驱动使用（本文重点描述这个共用的CMA area）。

1.1.4 配置CMA内存

如上文提到的，配置CMA内存区有两种方法：

一种是通过dts的reserved memory；
一种是通过command line参数和内核配置参数。

device tree 中可以包含

reserved-memory

node，在该节点的 child node中，可以定义各种保留内存的信息。compatible属性是

shared-dma-pool

的那个节点是专门用于建立 global CMA area的，而其他的child node都是for per device CMA area的。

Global CMA area 的初始化可以参考定义如下：

具体的setup过程倒是比较简单，从device tree中可以获取该memory range的起始地址和大小，调用

cma_init_reserved_mem

函数即可以注册一个CMA area。需要补充说明的是：CMA对应的

reserved memory

节点必须有

reusable

属性，不能有

no-map

的属性。

1.1.5 reusable 属性

reusable 属性的 reserved memory 有这样的特性：即在驱动不使用这些内存的时候，OS可以使用这些内存（当然有限制条件），而当驱动从这个CMA area分配memory的时候，OS可以reclaim这些内存，让驱动可以使用它。

no-map属性和地址映射相关，如果没有no-map属性，那么OS会为这段memory创建地址映射，象其他普通内存一样。但是有no-map属性的往往是专用于某个设备驱动，在驱动中会进行io remap，如果OS已经对这段地址进行了mapping，而驱动又一次mapping，这样就有不同的虚拟地址mapping到同一个物理地址上去，在某些ARCH上（ARMv6之后的cpu），会造成不可预知的后果。而CMA这个场景，reserved memory必须要mapping好，这样才能用于其他内存分配场景，例如page cache。

1.1.6 per device CMA

per device CMA area的注册过程和各自具体的驱动相关，但是最终会

dma_declare_contiguous

这个接口函数，为一个指定的设备而注册CMA area，这里就不详述了。

1.1.7 cmdline cma

通过命令行参数也可以建立cma area。我们可以通过

cma=nn[MG]@[start[MG][-end[MG]]]

这样命令行参数来指明Global CMA area在整个物理内存中的位置。

在初始化过程中，内核会解析这些命令行参数，获取CMA area的位置（起始地址，大小），并调用

cma_declare_contiguous

接口函数向CMA模块进行注册（当然，和device tree传参类似，最终也是调用

cma_init_reserved_mem

接口函数）。除了命令行参数，通过内核配置（CMA_SIZE_MBYTES和CMA_SIZE_PERCENTAGE）也可以确定CMA area的参数。

1.1.8 memblock 与 CMA的关系

内存管理子系统进行初始化的时候，首先是memblock掌控全局的，这时候需要确定整个系统的的内存布局，简单说就是了解整个memory的分布情况，哪些是memory block是memory type，哪些memory block是reserved type。毫无疑问，CMA area对应的当然是reserved type。最先进行的是memory type的内存块的建立，可以参考如下代码：

setup_arch--->setup_machine_fdt--->early_init_dt_scan
		--->early_init_dt_scan_nodes--->memblock_add

随后会建立reserved type的memory block，可以参考如下代码：

setup_arch--->arm64_memblock_init
		--->early_init_fdt_scan_reserved_mem
				--->__fdt_scan_reserved_mem--->memblock_reserve

完成上面的初始化之后，memblock模块已经通过device tree构建了整个系统的内存全貌：哪些是普通内存区域，哪些是保留内存区域。

对于那些reserved memory，我们还需要进行初始化，代码如下：

setup_arch--->arm64_memblock_init
	--->early_init_fdt_scan_reserved_mem
		--->fdt_init_reserved_mem
			--->__reserved_mem_init_node

上面的代码会scan内核中的一个特定的section（还记得前面

RESERVEDMEM_OF_DECLARE

的定义吗？），如果匹配就会调用相应的初始化函数，而对于Global CMA area而言，这个初始化函数就是

rmem_cma_setup

。当然，如果有需要，具体的驱动也可以定义自己的CMA area，初始化的思路都是一样的。

1.2 CMA 工作流程

1.2.1 准备知识

如果想要了解CMA是如何运作的，你可能需要知道一点点关于migrate types和pageblocks的知识。当从伙伴系统请求内存的时候，我们需要提供了一个gfp_mask的参数。它有很多的功能，不过在CMA这个场景，它用来指定请求页面的迁移类型（migrate type）。

migrate type有很多中，其中有一个是

MIGRATE_MOVABLE

类型，被标记为

MIGRATE_MOVABLE

的page说明该页面上的数据是可以迁移的。也就是说，如果需要，我们可以分配一个新的page，copy数据到这个new page上去，释放这个page。而完成这样的操作对系统没有任何的影响。我们来举一个简单的例子：对于内核中的data section，其对应的page不是是movable的，因为一旦移动数据，那么内核模块就无法访问那些页面上的全局变量了。而对于page cache这样的页面，其实是可以搬移的，只要让指针指向新的page就OK了。

伙伴系统不会跟踪每一个page frame的迁移类型，实际上它是按照pageblock为单位进行管理的，memory zone中会有一个bitmap，指明该zone中每一个pageblock的migrate type。在处理内存分配请求的时候，一般会首先从和请求相同migrate type（gfp_mask）的pageblocks中分配页面。如果分配不成功，不同migrate type的pageblocks中也会考虑，甚至可能改变pageblock的migrate type。这意味着一个non-movable页面请求也可以从migrate type是movable的pageblock中分配。这一点CMA是不能接受的，所以我们引入了一个新的migrate type：MIGRATE_CMA。这种迁移类型具有一个重要性质：只有可移动的页面可以从MIGRATE_CMA的pageblock中分配。

1.2.2 初始化 CMA area

static int __init cma_activate_area(struct cma *cma)
{ 
    int bitmap_size = BITS_TO_LONGS(cma_bitmap_maxno(cma)) 
    					* sizeof(long); 
    unsigned long base_pfn = cma->base_pfn, pfn = base_pfn; 
    unsigned i = cma->count >> pageblock_order; 
    struct zone *zone; －－－－－－－（1）
    cma->bitmap = kzalloc(bitmap_size, GFP_KERNEL); －－分配内存
    zone = page_zone(pfn_to_page(pfn)); －－找到page对应的memory zone
    do {－－－－－（2） 
        unsigned j;
        base_pfn = pfn; 
        for (j = pageblock_nr_pages; j; --j, pfn++) {－－－－－－（3） 
            if (page_zone(pfn_to_page(pfn)) != zone) 
                goto err; 
        } 
        init_cma_reserved_pageblock(pfn_to_page(base_pfn));－－（4） 
    } while (--i);
    mutex_init(&cma->lock);
    return 0;
}

（1）CMA area有一个bitmap来管理各个page的状态，这里

bitmap_size

给出了bitmap需要多少的内存。i变量表示该CMA area有多少个pageblock。

（2）遍历该CMA area中的所有的pageblock。

（3）确保CMA area中的所有page都是在一个memory zone内，同时累加了pfn，从而得到下一个pageblock的初始page frame number。

（4）将该pageblock导入到伙伴系统，并且将migrate type设定为

MIGRATE_CMA

。

分配连续内存

cma_alloc用来从指定的CMA area上分配count个连续的page frame，按照align对齐。具体的代码就不再分析了，比较简单，实际上就是从bitmap上搜索free page的过程，一旦搜索到，就调用
alloc_contig_range 向伙伴系统申请内存。需要注意的是，CMA内存分配过程是一个比较“重”的操作，可能涉及页面迁移、页面回收等操作，因此不适合用于atomic context。
释放连续内存

分配连续内存的逆过程，除了bitmap的操作之外，最重要的就是调用
free_contig_range ，将指定的pages返回伙伴系统。

【ARM Linux 内存管理入门及渐进 3 - CMA】

文章目录

1.1.1 历史背景

1.1.2 device tree reserved memory node

1.1.3 CMA 结构描述符

1.1.4 配置CMA内存

1.1.5 reusable 属性

1.1.6 per device CMA

1.1.7 cmdline cma

1.1.8 memblock 与 CMA的关系

1.2 CMA 工作流程

1.2.1 准备知识

1.2.2 初始化 CMA area

继续阅读

Apache (You don't have permission to access / on this server.）

debian9升级4.9.0内核到4.19.2内核过程

centOS7 配置 vsftpd 虚拟用户及权限Vsftpd配置虚拟用户及权限

linux-svn卸载与安装

vsftp虚拟多用户多权限一键部署脚本

Ubuntu14.04 LTS下安装mongodb

Nginx服务优化（1）——隐藏版本号、修改用户与组、网页缓存时间、日志切割、连接超时一、隐藏版本号二、修改用户与组三、配置Nginx网页缓存时间四、实现Nginx日志分割五、配置Nginx实现连接超时六、补充关于时间日期的命令

httpd服务的部署、启动、配置和简单优化一、部署二、启动三、配置文件

配置网页内容访问

手动安装Intel network I217-LM网卡的Linux驱动

禁止ubuntu系统弹出报错界面

Ubuntu Linux下Apache的配置文件

samba服务器的功能

【Linux】UDP广播报文接收速率问题

Linux设备模型（中）之上层容器

PowerPC平台 Linux移植三