Quantcast
Channel: CSDN博客推荐文章
Viewing all articles
Browse latest Browse all 35570

MMU的通俗理解

$
0
0

MMU的通俗理解

       看了两天了MMU,有点眉目,记下来。只说原理,不说具体的寄存器设置。
       没有MMU时候,CPU核和外部存储器直接对话。情况是这样的:
       

        有了MMU,CPU核外部存储器只找MMU(就好比:妈,我球鞋拿过来吧?妈,我初中的同学录在哪?这里边“妈”是MMU,“我”是CPU核)。按照上边的例子来说,这个“妈”要说的对象。
        
        对待这样的孩子(CPU核),这个妈(MMU)要有两样神器来对付。一是一个记事本(TLB);二是一个柜子(Cache)。先说生活中哪些用到的柜子。孩子的球鞋,袜子放到柜子中,这些孩子会每天要。直接去这里边拿给他;而对于“初中的同学录”偶尔才会一次的,放到一个地方。这个地方记在记事本(TLB)上,当孩子(CPU核)要的时候,告诉他在哪里,让他去拿。

        以上我以生活中的例子时行的通俗理解,也顺便做了一个流程图:
        
        最后来总结一下,加上MMU后看似复杂,但是没有妈(MMU)的话,对于孩子(CPU核)来说。找到袜子(常用数据)和找到“初中的同学录”(不常用数据)一样的费时。

        先有生活中的灵活例子,再有计算机的效仿,用生活中的例子来诠释计算机中的问题理容易理解。
        
        下边用一个开MMU和不开MMU的裸机程序的运行速度来验证一下:
@*************************************************************************
@ File:start.S
@ 功能:启动代码:设置存储控制器,设置页表,启动MMU,
@
@*************************************************************************       

.text
.global _start
_start:
    ldr sp, =4096                       @ 设置栈指针,以下都是C函数,调用前需要设好栈
    bl  pre_lowlevel_init               @ 关闭WATCHDOG,否则CPU会不断重启
    bl  mem_ctrl_asm_init               @ 设置存储控制器(MMU要用这个)
    bl  create_page_table               @ 设置页表
    bl  mmu_init                        @ 启动MMUbn
    ldr sp, =4096                       @ 重设栈指针,指向内部SRAM顶端(使用虚拟地址)
	bl  main
halt_loop:
    b   halt_loop

/*
 * 关看门狗
 */
pre_lowlevel_init:
	/* turn off the watchdog */
    #define pWTCON	0x53000000

	ldr	r0, =pWTCON
	mov	r1, #0x0
	str	r1, [r0]

	mov	pc, lr
/*$:  end_of pre_lowlevel_init */

/*
 * 存储器控制器初始化函数
 */
#define BWSCON	0x48000000

mem_ctrl_asm_init:
	adrl	r0, SMRDATA			@这13个值的起始存储地址 这里的adrl不能简单的用ldr替代
	ldr		r1, =BWSCON			/* Bus Width Status Controller  存储控制器的13个寄存器的开始地址 */
	add     r2, r0, #13*4
0:
	ldr     r3, [r0], #4		@ 读取设置值,并让r0加4
	str     r3, [r1], #4		@ 将此值写入寄存器,并让r1加4
	cmp     r2, r0				@ 判断是否设置完所有13个寄存器
	bne     0b					@ 若没有写成,继续

	mov	pc, lr


	.ltorg
/* the literal pools origin */

SMRDATA:
    .word   0x22011110      @ BWSCON
    .word   0x00000700      @ BANKCON0
    .word   0x00000700      @ BANKCON1
    .word   0x00000700      @ BANKCON2
    .word   0x00000700      @ BANKCON3
    .word   0x00000700      @ BANKCON4
    .word   0x00000700      @ BANKCON5
    .word   0x00018005      @ BANKCON6
    .word   0x00018005      @ BANKCON7
    .word   0x008C07A3      @ REFRESH
    .word   0x000000B1      @ BANKSIZE
    .word   0x00000030      @ MRSRB6
    .word   0x00000030      @ MRSRB7
/* end_of mem_ctrl_asm_init*/

/*
 * init.c: 进行一些初始化,在Steppingstone中运行
 * 它和head.S同属第一部分程序,此时MMU未开启,使用物理地址
 */ 


/*
 * 设置页表
 */
void create_page_table(void)
{

/* 
 * 用于段描述符的一些宏定义
 */ 
#define MMU_FULL_ACCESS     (3 << 10)   /* 访问权限 */
#define MMU_DOMAIN          (0 << 5)    /* 属于哪个域 */
#define MMU_SPECIAL         (1 << 4)    /* 必须是1 */
#define MMU_CACHEABLE       (1 << 3)    /* cacheable */
#define MMU_BUFFERABLE      (1 << 2)    /* bufferable */
#define MMU_SECTION         (2)         /* 表示这是段描述符 */
#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_SECTION)
#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE    0x00100000

    unsigned long virtuladdr, physicaladdr;
    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;
    
    /*
     * Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0,
     * 为了在开启MMU后仍能运行第一部分的程序,
     * 将0~1M的虚拟地址映射到同样的物理地址
     */
    virtuladdr = 0;
    physicaladdr = 0;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC_WB;

    /*
     * 0x56000000是GPIO寄存器的起始物理地址,
     * GPBCON和GPBDAT这两个寄存器的物理地址0x56000010、0x56000014,
     * 为了在第二部分程序中能以地址0xA0000010、0xA0000014来操作GPBCON、GPBDAT,
     * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
     */
    virtuladdr = 0xA0000000;
    physicaladdr = 0x56000000;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC;

    /*
     * SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
     * 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
     * 总共64M,涉及64个段描述符
     */
    virtuladdr = 0xB0000000;
    physicaladdr = 0x30000000;
    while (virtuladdr < 0xB4000000)
    {
        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                                MMU_SECDESC_WB;
        virtuladdr += 0x100000;
        physicaladdr += 0x100000;
    }
}

/*
 * 启动MMU
 */
void mmu_init(void)
{
    unsigned long ttb = 0x30000000;

__asm__(
    "mov    r0, #0\n"
    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */
    
    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */
    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */
    
    "mov    r4, %0\n"                   /* r4 = 页表基址 */
    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */
    
    "mvn    r0, #0\n"                   
    "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF,
                                         * 不进行权限检查 
                                         */    
    /* 
     * 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,
     * 然后再写入
     */
    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */
    
    /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
     * R : 表示换出Cache中的条目时使用的算法,
     *     0 = Random replacement;1 = Round robin replacement
     * V : 表示异常向量表所在的位置,
     *     0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
     * I : 0 = 关闭ICaches;1 = 开启ICaches
     * R、S : 用来与页表中的描述符一起确定内存的访问权限
     * B : 0 = CPU为小字节序;1 = CPU为大字节序
     * C : 0 = 关闭DCaches;1 = 开启DCaches
     * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
     * M : 0 = 关闭MMU;1 = 开启MMU
     */
    
    /*  
     * 先清除不需要的位,往下若需要则重新设置它们    
     */
                                        /* .RVI ..RS B... .CAM */ 
    "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */
    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */
    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */

    /*
     * 设置需要的位
     */
    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */
    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */
    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */
    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */
    
    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */
    : /* 无输出 */
    : "r" (ttb) );
}

/*
 * leds.c: 循环点亮4个LED
 * 属于第二部分程序,此时MMU已开启,使用虚拟地址
 */ 

/*
 * MMU开过后,物理地址就不能用了 可以替换试试
 * 也可以关闭mmu,换成物理地址,感受led速度不同
 * 开的MMU时也开了Cache,TLB速度是它们提高的
 */
#define GPBCON      (*(volatile unsigned long *)0xA0000010)     // 物理地址0x56000010 虚拟地址0xA0000010
#define GPBDAT      (*(volatile unsigned long *)0xA0000014)     // 物理地址0x56000014 虚拟地址0xA0000014

#define GPB5_out    (1<<(5*2))
#define GPB6_out    (1<<(6*2))
#define GPB7_out    (1<<(7*2))
#define GPB8_out    (1<<(8*2))

/*
 * wait函数加上“static inline”是有原因的,
 * 这样可以使得编译leds.c时,wait嵌入main中,编译结果中只有main一个函数。
 * 于是在连接时,main函数的地址就是由连接文件指定的运行时装载地址。
 * 而连接文件mmu.lds中,指定了leds.o的运行时装载地址为0xB4004000,
 * 这样,head.S中的“ldr pc, =0xB4004000”就是跳去执行main函数。
 */
static inline void wait(volatile unsigned long dly)
{
    for(; dly > 0; dly--);
}

int main(void)
{
    unsigned long i = 0;
    
    // 将LED1-4对应的GPB5/6/7/8四个引脚设为输出
    GPBCON = GPB5_out|GPB6_out|GPB7_out|GPB8_out;       

    while(1){
        wait(3000000);
        GPBDAT = (~(i<<5));     // 根据i的值,点亮LED1-4
        if(++i == 16)
            i = 0;
    }

    return 0;
}

objs := start.o init.o leds.o

all : mmu.bin
mmu.bin : $(objs)
	arm-linux-ld -Ttext 0x00000000 -o mmu_elf $^
	arm-linux-objcopy -O binary -S mmu_elf $@
	arm-linux-objdump -D -m arm mmu_elf > mmu.dis
	
%.o:%.c
	arm-linux-gcc -g -Wall -O2 -c -o $@ $<

%.o:%.S
	arm-linux-gcc -g -Wall -O2 -c -o $@ $<

clean:
	rm -f mmu.bin mmu_elf mmu.dis *.o	

         上边的程序是开启了MMU,改为不开MMU的话要在start.S中注释掉bl  mmu_init                        @ 启动MMUbnleds中GPBCON GPBDAT改为物理地址
         快慢的体现在于wait(3000000);同是一个函数,开不开Cache就不一样了。直观一点的就是LED的变化速度会有明显的不一样。这个MMU Cache估计也只有裸机能实验一下了。有了系统,这就是系统级的东西,应用程度没有权限管理这个了。




作者:kangear 发表于2013-4-13 17:47:11 原文链接
阅读:24 评论:0 查看评论

Viewing all articles
Browse latest Browse all 35570

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>