加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

linux下比较2个文件

(2011-07-20 00:10:48)
标签:

杂谈

inux下比较2个文件的不同,分两种(文本文件和二进制文件)
 

一、文本文件比较

1、如果想对两个有序的文件进行比较,可以使用comm命令。

语法:comm [- 123 ] file1 file2

说明:该命令是对两个已经排好序的文件进行比较。其中file1和file2是已排序的文件。comm读取这两个文件,然后生成三列输出:仅在file1中出现的行;仅在file2中出现的行;在两个文件中都存在的行。如果文件名用“- ”,则表示从标准输入读取。

选项1、2或3抑制相应的列显示。例如
comm - 12就只显示在两个文件中都存在的行;
comm - 23只显示在第一个文件中出现而未在第二个文件中出现的行;
comm - 123则什么也不显示。

例如:假设要对文件myfile1和myfile2进行比较

$ cat myfile1
main( )
{
float a,b, i, j ,z ;
a=i=10 ; b=j=5 ;
z= i + j ;
printf(“z=%d\\\ ”,z) ;
 
}
$ cat myfile2
#include
main( )
{
float i, j ,z ;
i=10 ; j=5 ;
z= i + j ;
printf(“z=%f\\\ ”,z);
 
}
$ comm - 12 myfile1 myfile2
main( )
{
z= i + j ;
 
}
就只显示文件myfile1和myfile2中共有的行。

----------------------------------------------------
2、如果文本文件没有排序,可以使用Diff命令

该命令的功能为逐行比较两个文本文件,列出其不同之处。它比comm命令完成更复杂的检查。它对给出的文件进行系统的检查,并显示出两个文件中所有不同的行,不要求事先对文件进行排序。

语法:diff [选项] file1 file2

说明:该命令告诉用户,为了使两个文件file1和file2一致,需要修改它们的哪些行。如果用“- ”表示file1或fiie2,则表示标准输入。如果file1或file2是目录,那么diff将使用该目录中的同名文件进行比较。例如:

diff /usr/xu mine

把目录/usr/xu 中名为mine的文件与当前目录中的mine文件进行比较。

通常输出由下述形式的行组成:

n1 a n3,n4

n1,n2 d n3

n1,n2 c n3,n4

这些行类似ed命令把filel转换成file2。字母(a、d和c)之前的行号(n1,n2)是针对file1的,其后面的行号(n3,n4)是针对file2的。字母a、d和c分别表示附加、删除和修改操作。

在上述形式的每一行的后面跟随受到影响的若干行,以“<”打头的行属于第一个文件,以“>”打头的行属于第二个文件。

diff能区别块和字符设备文件以及FIFO(管道文件),不会把它们与普通文件进行比较。

如果file1和file2都是目录,则diff会产生很多信息。如果一个目录中只有一个文件,则产生一条信息,指出该目录路径名和其中的文件名。

diff各选项的含义如下:

- b 忽略行尾的空格,而字符串中的一个或多个空格符都视为相等。如How are you与How are you被视为相同的字符串。

- c 采用上下文输出格式(提供三行上下文)。

- C n 采用上下文输出格式(提供n行上下文)。

- e 产生一个合法的ed脚本作为输出。

- r 当file1和file2是目录时,递归作用到各文件和目录上。

例如,文件ml.c的内容为(左边行号是有意加上的,以便前后对照):

1 main( )

{

     printf(“Hello!\n”);

}

5

文件m2.c的内容为:

1 main()

2 {

     int n , m ;

     n= 10 ;

     printf ( “ % d \\\\ n ” , m = n * 10);

6 }

输入命令:

$ diff m1.c m2.c

屏幕上显示:

3,5 c 3,6

printf(“Hello!\n”);

}

<5

>3 int n,m;

>4 n=10 ;

>5 printf ( “ % d \\\\ n ” , m = n * 10);

>6 }

 表示把文件m1.c的3至5行改成m2.c的3至6行后,两个文件相同。
 

3、比较二进制文件,cmp命令

用途

比较两个文件的内容并报告不同的第一个字符。
语法

cmp [  -l |  -s ] File1 File2
描述

cmp 命令比较 File1 和 File2 参数指定的文件,并将结果写到标准输出。如果为 File1 或 File2 参数指定 -(减号),则 cmp 命令读取该文件的标准输入。只可以从标准输入读取一个文件。在缺省条件下,如果文件相同,则 cmp 命令不显示任何内容。如果它们不同,则 cmp 命令显示发生不同的第一个字节数和行数。如果指定了 -l 标志,并且如果一个文件是另一文件的初始后继(即,如果在查找任何差别之前,cmp 命令读取文件中的文件结束符),则 cmp 命令记下它。通常,使用 cmp 命令比较非文本文件,使用 diff 命令比较文本文件
标志
-l     对于每个不同,(小写字母 L)显示十进制的字节数和八进制的不同字节。
-s     只返回退出值。值 0 指示相同的文件;值 1 指示不同的文件;值 2 指示不可访问的文件或缺少选项。
退出状态

该命令返回以下退出值:
0     文件相同。
1     文件不同。即使一个文件是另一个文件的初始后继(一个文件与另一个文件的第一个部分相同),也给出该值。
>1     发生错误。
示例

   1. 要确定两个文件是否相同,请输入:

      cmp prog.o.bak prog.o

      这比较 prog.o.bak 和 prog.o。如果文件相同,则不显示消息。如果文件不同,则显示第一个不同的位置;例如:

      prog.o.bak prog.o differ: char 4, line 1

      如果显示消息 cmp: EOF on prog.o.bak,则 prog.o 的第一部分与 prog.o.bak 相同,但在 prog.o 中还有其他数据。
   2. 要显示不同字节的每个对,请输入:
      cmp  -l prog.o.bak prog.o
      这比较文件,然后显示字节数(使用十进制格式)和每个不同的不同字节(使用八进制格式)。例如,如果第五个字节在 prog.o.bak 中是八进制 101,在 prog.o 中是 141,则 cmp 命令显示:

      5 101 141

   3. 要比较两个文件,而不写任何消息,请输入:
      cmp  -s prog.c.bak prog.c
      这样,如果文件相同,则给出值 0,如果不同,则给出值 1,或者如果发生错误,则给出值 2。该命令形式通常用在 shell 步骤中。例如:
      if cmp  -s prog.c.bak prog.c
      then
      echo No change
      fi
      如果两个文件相同,则该部分的 shell 步骤显示 No change。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有