Skip to content

grep.c

TIP

简单的 grep。只支持 ^, ., *, $ 操作符。

TIP

包含内核数据类型定义

#include "kernel/types.h"

TIP

包含文件状态信息

#include "kernel/stat.h"

TIP

包含文件控制选项

#include "kernel/fcntl.h"

TIP

包含用户态 API

#include "user/user.h"

char buf[1024];
int match(char*, char*);

TIP

在文件描述符 fd 中搜索 pattern

void
grep(char *pattern, int fd)
{
  int n, m;
  char *p, *q;

  m = 0;

TIP

从 fd 读取数据到 buf

  while((n = read(fd, buf+m, sizeof(buf)-m-1)) > 0){
    m += n;
    buf[m] = '\0';
    p = buf;

TIP

按行处理

    while((q = strchr(p, '\n')) != 0){
      *q = 0;

TIP

如果当前行匹配 pattern

      if(match(pattern, p)){
        *q = '\n';

TIP

打印匹配的行

        write(1, p, q+1 - p);
      }
      p = q+1;
    }

TIP

将未处理完的数据移动到 buf 的开头

    if(m > 0){
      m -= p - buf;
      memmove(buf, p, m);
    }
  }
}

TIP

程序入口

int
main(int argc, char *argv[])
{
  int fd, i;
  char *pattern;

TIP

参数检查

  if(argc <= 1){
    fprintf(2, "用法: grep pattern [file ...]\n");
    exit(1);
  }
  pattern = argv[1];

TIP

如果没有指定文件,则从标准输入读取

  if(argc <= 2){
    grep(pattern, 0);
    exit(0);
  }

TIP

遍历所有文件

  for(i = 2; i < argc; i++){
    if((fd = open(argv[i], O_RDONLY)) < 0){
      printf("grep: cannot open %s\n", argv[i]);
      exit(1);
    }
    grep(pattern, fd);
    close(fd);
  }
  exit(0);
}

TIP

正则表达式匹配器,来自 Kernighan & Pike, The Practice of Programming, Chapter 9, or https://www.cs.princeton.edu/courses/archive/spr09/cos333/beautiful.html

int matchhere(char*, char*);
int matchstar(int, char*, char*);

TIP

在 text 中搜索 re

int
match(char *re, char *text)
{

TIP

如果 re 以 ^ 开头,则从 text 开头匹配

  if(re[0] == '^')
    return matchhere(re+1, text);

TIP

否则,在 text 的任意位置进行匹配

  do{
    if(matchhere(re, text))
      return 1;
  }while(*text++ != '\0');
  return 0;
}

TIP

matchhere: 在 text 的开头搜索 re

int matchhere(char *re, char *text)
{
  if(re[0] == '\0')
    return 1;
  if(re[1] == '*')
    return matchstar(re[0], re+2, text);
  if(re[0] == '$' && re[1] == '\0')
    return *text == '\0';
  if(*text!='\0' && (re[0]=='.' || re[0]==*text))
    return matchhere(re+1, text+1);
  return 0;
}

TIP

matchstar: 在 text 的开头搜索 c*re

int matchstar(int c, char *re, char *text)
{

TIP

  • 匹配零个或多个实例
  do{
    if(matchhere(re, text))
      return 1;
  }while(*text!='\0' && (*text++==c || c=='.'));
  return 0;
}