编译原理学习周入门教程--（七）编译程序第一个工作阶段-词法分析(正规式)

上篇讲述了句型的两种类型--自上而下和自下而上，本篇进入编译程序的第一个工作阶段--词法分析。

我们在第二篇中讲述了关于词法分析的简单介绍，词法分析工作可以独立的一遍，把字符流的源程序变成单词序列，输出在一个中间文件上，这个文件作为下一个工作阶段-词法分析程序的输入而继续编译的过程。

一般情况下降词法程序设计成一个子程序，每当语法分析程序需要一个单词的时候，则调用该子程序。词法分析程序每得到一次调用，便从源程序文件中读入一些字符，直到识别出一个单词。

那经过第一阶段的加工，我们的词法分析之后，得到什么？

词法分析的输出：读入源程序，输出单词符号，单词符号包括单词的中类和单词自身的值，例如关键字有 end if 、while、var等；运算符有+ ，*，《=等。

又有一个问题了，为什么要有这个阶段，将词法分析这个工作分为一个阶段？为什么将编译过程分为词法分析和语法分析？

笔者认为这就和三层架构一样，系统为什么要分为三层架构？其实这也和我们的生活有关，现代社会不再单靠一个人单打独斗的社会，我们当代的社会人们分工明确，各司其职，社会稳步发展~ 这样提高全社会运转效率。我们的编译程序也是，主要原因有一下三点：

1、使整个编译程序的结构更加简洁、清晰和条理化。

2、编译程序的效率会改进。

3、增强了编译程序的可移植性。

词法分析开始：

词法分析开始，第一步当然是要从源程序中读入单词了，我们在文法中描述单词的工具是什么？正规式（也称正则表达式），是用以描述单词符号的方便工具。

正规式和正规集定义：

正规式	正规集
a	{a}
a\|b	{a,b}
ab	{ab}
(a\|b)(a\|b)	{aa,ab,ba,bb}
a*	{ε，a，aa，aaa，..任意个a串}
(a\|b)*	{ε，a，b，aa，ab，....所有a,b组成的串}
(a\|b)(aa\|bb)(a\|b)	字母表集合内，所含有两个相继的a或两个相继的b组成的串

正规式服从代数规律：
1）r|s = s|r

2)r|(s|t) = (r|s)|t

3)(rs)t = r(st)

4)r(s|t)r = sr|tr

5)εr = r rε = r

6)r|r = r

正规文法和正规式的转换：

	文法产生式	正规式
规则一	A-> xB B->y	A = xy
规则二	A->xA\|y	A = x*y
规则三	A->x A->y	A = x\|y

例如：

将r = a(a|d)* 转换为相应的正规文法。

S->a(a|d)* ==> S->aA A->(a|d)* ==>A->(a|d)B A->ε ==>B->(a|d)B B->ε

转换结果为：S->aA A->(a|d)B A->ε B->(a|d)B B->ε

单词的识别工具--正规式，本篇讲述到这里，下一篇讲述正规式的识别装置--有穷自动机。

愿开心阅读O(∩_∩)O~~

作者：lovesummerforever 发表于2013-6-8 6:37:08 原文链接

阅读：103 评论：0 查看评论

编译原理学习周入门教程--（七）编译程序第一个工作阶段-词法分析(正规式)

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本