天天看点

Lex/Yacc Lex结合Yacc

这次就来尝试lex结合yacc。 简单lex 先写个简单lex,如下:

%{
#include "name.tab.h"

#include <stdio.h>
#include <string.h>
extern char* yylval;
%}
char [A-Za-z]
num [0-9]
eq [=]
name {char}+
age {num}+
%%
{name} { yylval = strdup(yytext);
return NAME;}
{eq} {return EQ;}
{age} {yylval = strdup(yytext);
return AGE;}
%%
int yywrap()
{
return 1;
}
           

这个lex的意思是说, 1. 提取符合name规则的内容,也就是A-Za-z组成的单词 2. 提取eq,也就是= 3. 提取age,也就是0-9组成的数字。 然后把提取出来的内容放到一个变量yylval里面。 编译使用名flex name.lex,产生一个.c文件,就是lex.yy.c,如截图所示:

Lex/Yacc Lex结合Yacc

简单yacc例子 接下来先写个yacc文件,如:

%{
typedef char* string;
#define YYSTYPE string
#include "lex.yy.c"
%}
%token NAME EQ AGE
%%
file : record file
| record
;
record : NAME EQ AGE {
printf("%s is %s years old!!!", $1, $3); }
;
%%
int main()
{
yyparse();
return 0;
}
int yyerror(char* msg)
{
printf("Error : %s \n", msg);
}
           

这里有几个东西需要说明一下: 1. #define YYSTYPE string, YYSTYPE是指yylval变量的类型,yylval是用来在lex里面把内容填充进去,然后yyac里面访问的。 2. NAME EQ AGE这3个token也是在yacc里面定义,然后lex里面使用的。 3. record : NAME EQ AGE意思是说,符合NAME EQ AGE这种类型的内容提出来。看lex的定义可以知道,这种内容应该是 “NAME=AGE"的形式,NAME是指A-Za-z组成的单词,AGE是0-9组成的数字。 创建一个yacc文件name.y,把上面的内容丢进去,同样编译一下: bison -d name.y 看一下截图:

Lex/Yacc Lex结合Yacc

多了两个文件,lex会include ”name.tab.h",因为lex需要使用yacc定义的一些东西。 接下来,编译name.tab.c,如: gcc name.tab.c 看截图:

Lex/Yacc Lex结合Yacc

多了一个a.out可执行文件。 使用lex+yacc 直接跑一下吧: ./a.out 然后看一下截图:

Lex/Yacc Lex结合Yacc

第一次输入两个符合的内容,被捕获两次,并且打出了log,没问题。 第二次输入一个内容,也没问题。 第三次就有问题了,应输入的name是kevin2016,而我们在lex里面定义的name只能是A-Za-z组成的单词,所以报错。 有关报错,是我们在yacc里面定义的yyerror()。 这个文章里面的例子,只要有一条不符合规则,就报错了。 看如下:

Lex/Yacc Lex结合Yacc

第一次测试一条符合的都没找到,第二条第一个还是符合的,第二个不符合,就报错退出了。

总结: lex:就是用来提取符合一定规则的内容 yacc:分析lex提取过来的内容,然后做进一步操作。