MMU的通俗理解
看了两天了MMU,有点眉目,记下来。只说原理,不说具体的寄存器设置。
没有MMU时候,CPU核和外部存储器直接对话。情况是这样的:
有了MMU,CPU核外部存储器只找MMU(就好比:妈,我球鞋拿过来吧?妈,我初中的同学录在哪?这里边“妈”是MMU,“我”是CPU核)。按照上边的例子来说,这个“妈”要说的对象。
对待这样的孩子(CPU核),这个妈(MMU)要有两样神器来对付。一是一个记事本(TLB);二是一个柜子(Cache)。先说生活中哪些用到的柜子。孩子的球鞋,袜子放到柜子中,这些孩子会每天要。直接去这里边拿给他;而对于“初中的同学录”偶尔才会一次的,放到一个地方。这个地方记在记事本(TLB)上,当孩子(CPU核)要的时候,告诉他在哪里,让他去拿。
以上我以生活中的例子时行的通俗理解,也顺便做了一个流程图:
最后来总结一下,加上MMU后看似复杂,但是没有妈(MMU)的话,对于孩子(CPU核)来说。找到袜子(常用数据)和找到“初中的同学录”(不常用数据)一样的费时。
先有生活中的灵活例子,再有计算机的效仿,用生活中的例子来诠释计算机中的问题理容易理解。
下边用一个开MMU和不开MMU的裸机程序的运行速度来验证一下:
@************************************************************************* @ File:start.S @ 功能:启动代码:设置存储控制器,设置页表,启动MMU, @ @************************************************************************* .text .global _start _start: ldr sp, =4096 @ 设置栈指针,以下都是C函数,调用前需要设好栈 bl pre_lowlevel_init @ 关闭WATCHDOG,否则CPU会不断重启 bl mem_ctrl_asm_init @ 设置存储控制器(MMU要用这个) bl create_page_table @ 设置页表 bl mmu_init @ 启动MMUbn ldr sp, =4096 @ 重设栈指针,指向内部SRAM顶端(使用虚拟地址) bl main halt_loop: b halt_loop /* * 关看门狗 */ pre_lowlevel_init: /* turn off the watchdog */ #define pWTCON 0x53000000 ldr r0, =pWTCON mov r1, #0x0 str r1, [r0] mov pc, lr /*$: end_of pre_lowlevel_init */ /* * 存储器控制器初始化函数 */ #define BWSCON 0x48000000 mem_ctrl_asm_init: adrl r0, SMRDATA @这13个值的起始存储地址 这里的adrl不能简单的用ldr替代 ldr r1, =BWSCON /* Bus Width Status Controller 存储控制器的13个寄存器的开始地址 */ add r2, r0, #13*4 0: ldr r3, [r0], #4 @ 读取设置值,并让r0加4 str r3, [r1], #4 @ 将此值写入寄存器,并让r1加4 cmp r2, r0 @ 判断是否设置完所有13个寄存器 bne 0b @ 若没有写成,继续 mov pc, lr .ltorg /* the literal pools origin */ SMRDATA: .word 0x22011110 @ BWSCON .word 0x00000700 @ BANKCON0 .word 0x00000700 @ BANKCON1 .word 0x00000700 @ BANKCON2 .word 0x00000700 @ BANKCON3 .word 0x00000700 @ BANKCON4 .word 0x00000700 @ BANKCON5 .word 0x00018005 @ BANKCON6 .word 0x00018005 @ BANKCON7 .word 0x008C07A3 @ REFRESH .word 0x000000B1 @ BANKSIZE .word 0x00000030 @ MRSRB6 .word 0x00000030 @ MRSRB7 /* end_of mem_ctrl_asm_init*/
/* * init.c: 进行一些初始化,在Steppingstone中运行 * 它和head.S同属第一部分程序,此时MMU未开启,使用物理地址 */ /* * 设置页表 */ void create_page_table(void) { /* * 用于段描述符的一些宏定义 */ #define MMU_FULL_ACCESS (3 << 10) /* 访问权限 */ #define MMU_DOMAIN (0 << 5) /* 属于哪个域 */ #define MMU_SPECIAL (1 << 4) /* 必须是1 */ #define MMU_CACHEABLE (1 << 3) /* cacheable */ #define MMU_BUFFERABLE (1 << 2) /* bufferable */ #define MMU_SECTION (2) /* 表示这是段描述符 */ #define MMU_SECDESC (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \ MMU_SECTION) #define MMU_SECDESC_WB (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \ MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION) #define MMU_SECTION_SIZE 0x00100000 unsigned long virtuladdr, physicaladdr; unsigned long *mmu_tlb_base = (unsigned long *)0x30000000; /* * Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0, * 为了在开启MMU后仍能运行第一部分的程序, * 将0~1M的虚拟地址映射到同样的物理地址 */ virtuladdr = 0; physicaladdr = 0; *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC_WB; /* * 0x56000000是GPIO寄存器的起始物理地址, * GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014, * 为了在第二部分程序中能以地址0xA0000010、0xA0000014来操作GPBCON、GPBDAT, * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间 */ virtuladdr = 0xA0000000; physicaladdr = 0x56000000; *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC; /* * SDRAM的物理地址范围是0x30000000~0x33FFFFFF, * 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上, * 总共64M,涉及64个段描述符 */ virtuladdr = 0xB0000000; physicaladdr = 0x30000000; while (virtuladdr < 0xB4000000) { *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \ MMU_SECDESC_WB; virtuladdr += 0x100000; physicaladdr += 0x100000; } } /* * 启动MMU */ void mmu_init(void) { unsigned long ttb = 0x30000000; __asm__( "mov r0, #0\n" "mcr p15, 0, r0, c7, c7, 0\n" /* 使无效ICaches和DCaches */ "mcr p15, 0, r0, c7, c10, 4\n" /* drain write buffer on v4 */ "mcr p15, 0, r0, c8, c7, 0\n" /* 使无效指令、数据TLB */ "mov r4, %0\n" /* r4 = 页表基址 */ "mcr p15, 0, r4, c2, c0, 0\n" /* 设置页表基址寄存器 */ "mvn r0, #0\n" "mcr p15, 0, r0, c3, c0, 0\n" /* 域访问控制寄存器设为0xFFFFFFFF, * 不进行权限检查 */ /* * 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位, * 然后再写入 */ "mrc p15, 0, r0, c1, c0, 0\n" /* 读出控制寄存器的值 */ /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM * R : 表示换出Cache中的条目时使用的算法, * 0 = Random replacement;1 = Round robin replacement * V : 表示异常向量表所在的位置, * 0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000 * I : 0 = 关闭ICaches;1 = 开启ICaches * R、S : 用来与页表中的描述符一起确定内存的访问权限 * B : 0 = CPU为小字节序;1 = CPU为大字节序 * C : 0 = 关闭DCaches;1 = 开启DCaches * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查 * M : 0 = 关闭MMU;1 = 开启MMU */ /* * 先清除不需要的位,往下若需要则重新设置它们 */ /* .RVI ..RS B... .CAM */ "bic r0, r0, #0x3000\n" /* ..11 .... .... .... 清除V、I位 */ "bic r0, r0, #0x0300\n" /* .... ..11 .... .... 清除R、S位 */ "bic r0, r0, #0x0087\n" /* .... .... 1... .111 清除B/C/A/M */ /* * 设置需要的位 */ "orr r0, r0, #0x0002\n" /* .... .... .... ..1. 开启对齐检查 */ "orr r0, r0, #0x0004\n" /* .... .... .... .1.. 开启DCaches */ "orr r0, r0, #0x1000\n" /* ...1 .... .... .... 开启ICaches */ "orr r0, r0, #0x0001\n" /* .... .... .... ...1 使能MMU */ "mcr p15, 0, r0, c1, c0, 0\n" /* 将修改的值写入控制寄存器 */ : /* 无输出 */ : "r" (ttb) ); }
/* * leds.c: 循环点亮4个LED * 属于第二部分程序,此时MMU已开启,使用虚拟地址 */ /* * MMU开过后,物理地址就不能用了 可以替换试试 * 也可以关闭mmu,换成物理地址,感受led速度不同 * 开的MMU时也开了Cache,TLB速度是它们提高的 */ #define GPBCON (*(volatile unsigned long *)0xA0000010) // 物理地址0x56000010 虚拟地址0xA0000010 #define GPBDAT (*(volatile unsigned long *)0xA0000014) // 物理地址0x56000014 虚拟地址0xA0000014 #define GPB5_out (1<<(5*2)) #define GPB6_out (1<<(6*2)) #define GPB7_out (1<<(7*2)) #define GPB8_out (1<<(8*2)) /* * wait函数加上“static inline”是有原因的, * 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。 * 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。 * 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000, * 这样,head.S中的“ldr pc, =0xB4004000”就是跳去执行main函数。 */ static inline void wait(volatile unsigned long dly) { for(; dly > 0; dly--); } int main(void) { unsigned long i = 0; // 将LED1-4对应的GPB5/6/7/8四个引脚设为输出 GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out; while(1){ wait(3000000); GPBDAT = (~(i<<5)); // 根据i的值,点亮LED1-4 if(++i == 16) i = 0; } return 0; }
objs := start.o init.o leds.o all : mmu.bin mmu.bin : $(objs) arm-linux-ld -Ttext 0x00000000 -o mmu_elf $^ arm-linux-objcopy -O binary -S mmu_elf $@ arm-linux-objdump -D -m arm mmu_elf > mmu.dis %.o:%.c arm-linux-gcc -g -Wall -O2 -c -o $@ $< %.o:%.S arm-linux-gcc -g -Wall -O2 -c -o $@ $< clean: rm -f mmu.bin mmu_elf mmu.dis *.o
上边的程序是开启了MMU,改为不开MMU的话要在start.S中注释掉bl mmu_init @ 启动MMUbn和leds中GPBCON GPBDAT改为物理地址。
快慢的体现在于wait(3000000);同是一个函数,开不开Cache就不一样了。直观一点的就是LED的变化速度会有明显的不一样。这个MMU Cache估计也只有裸机能实验一下了。有了系统,这就是系统级的东西,应用程度没有权限管理这个了。
作者:kangear 发表于2013-4-13 17:47:11 原文链接
阅读:24 评论:0 查看评论