find:根据指定条件查找文件

find 是一个资深的 UNIX® 工具。它的功能在于递归扫描一个或多个目录,从中查找匹配指定条件的文件。尽管此工具非常有用,但语法却十分复杂,使用的时候也需要多多练习。最普通的语法是这样的:

find [选项] [目录] [条件] [动作]

如果您不指定任何目录,find 将会查找当前目录。如果您不指定条件,则条件相当于“true”,这样会把全部文件都找出来。选项、条件和动作的设置十分繁多,我们在这里只会提到其中的少数几个。首先,让我们来看看着几个选项:

条件可以是一个或多个原子测试。这是一些有用的测试:

可供选择的设置还有很多,请参看 find(1) 中的详情。要进行组合测试,您可以使用以下格式之一:

最后,您可以为找到的文件指定一个动作。最常用的有:

要理解这些选项和参数最好的方法是执行一些例子。现在,您想要在 /usr/share 目录中查找全部目录,只需输入:

find /usr/share -type d

假设您有 HTTP 服务器,而您所有的 HTML 文件都存在 /var/www/html,该目录也是您的当前目录。您想要查找一个月来没有编辑过的全部文件。由于您拥有来自不同作者的页面,所以有些文件的扩展名是 html,有些文件的扩展名是 htm。您想要将这些文件链接在目录 /var/www/obsolete 中。您应该输入[17]

find \( -name "*.htm" -o -name "*.html" \) -a -ctime -30 \
-exec ln {} /var/www/obsolete \;

这个例子看起来有点复杂,我们会进行详细解释。这里所用的条件是:

\( -name "*.htm" -o -name "*.html" \) -a -ctime -30

它所完成的功能正是我们想要的:它会找到文件名以 .htm.html\( -name "*.htm" -o -name "*.html" \)” 结尾的文件,而且(-a) 在最近的三十天内没有修改过,这大概是一个月(-ctime -30)。请额外注意括号:这里的括号时必需的,因为 -a 的优先级较高。如果没有括号的话,将会找到所有以 .htm 结尾的文件,以及所有一个月以来没有修改过且以 .html 结尾的文件。这显然不是我们所需要的结果。您还应该注意括号需要在 shell 中加以转码:如果我们写的是 ( .. ),而不是 \( .. \),那么 shell 就会对括号进行解释,并且试图在子 shell 中执行 -name "*.htm" -o -name "*.html"……另外一种解决方案是将括号放在双引号或单引号中,但是我们更愿意在此使用反斜线,因为这里只有一个字符。

最后,还要对每个文件执行这个命令:

-exec ln {} /var/www/obsolete \;

这里,您仍然需要对分号(;)进行转码,否则 shell 会将其解释为命令分隔符。如果您忘记了进行转码,find 将会抱怨说 -exec 缺少一个参数。

最后一个例子:您有一个非常大的目录(/shared/images),其中包含各种图像。通常,您会使用 touch 命令更新此目录中名为 stamp 的文件的时间,这样您就会有一个可参考的时间。您想要找到比 stamp 文件新的所有 JPEG 图像,但是您的图像来源各不相同,文件扩展名有 jpgjpegJPG 以及 JPEG。您还想要不在 old 目录中搜索。不仅如此,您还想要将此文件列表发送给您,而您的用户名是 li_si

find /shared/images -cnewer     \
     /shared/images/stamp       \
     -a -iregex ".*\.jpe?g"     \
     -a -not -regex ".*/old/.*" \
       | mail li_si -s "New images"

当然,如果您每次都要重复输入的话,这个命令确实没什么用。您可能会想要定时执行该命令。要定时运行命令,最简单的方法就是使用下一节介绍的 cron 守护程序。



[17] 请注意,这个例子需要 /var/www/var/www/obsolete 在同一个文件系统中!