使用已删除的文档脚本


使用已删除的文档脚本
 
 既然有了一个被删除文件的目录,而且这个目录是在用户的家目录下的隐藏目录,那么一个让用户检索这些已删除文件的脚本的程序就会非常有用了。不管怎样,想要表明所有可能发生的情况是很难的,因为它包括了没有匹配、仅有一个匹配以及多个匹配三种情况。在多个匹配的情形中,比如,你是想要挑出最新的文件,然后将它还原?还是指明有多少种情况匹配成功,然后就退出?又或是展示下不同情况的数据然后供用户挑选?下面,让我们来看看我们到底都能做些什么...
 
001
#!/bin/sh
002
  
003
 # unrm.sh -- 查找已删除文档中的给定文件或是目录
004
 # 如果有多个匹配,那么给出一个按时间戳排序的结果列表,
005
 # 然后,让用户指定还原哪个
006
  
007
 mydir="$HOME/.deleted-files"
008
 realrm="/bin/rm"
009
 move="/bin/mv"
010
  
011
 dest=$(pwd)
012
  
013
 if [ ! -d $mydir ]; then
014
     echo "`basename $0`: No deleted files directory: nothing to unrm" >&2
015
     exit 1
016
 fi
017
  
018
 cd $mydir
019
  
020
 if [ $# -eq 0 ]; then
021
     echo "Contents of your deleted files archive(sorted by data):"   
022
     # ls中的-F是给列出来的项增加指示器,比如,文件不加后缀,目录加斜杠/,可执行文件加星号*
023
     # ls中的-C是按照列显示
024
     ls -FC | sed -e 's/\([[:digit:]][[:digit:]]\.\)\{5\}//g' \
025
     -e 's/^/ /'    # 这条替换的目的是给行头加空格
026
     exit 0
027
 fi
028
  
029
 # 否则,我们必须使用一个用户指定的模式。
030
 # 让我们来看看该模式在文档中是否匹配多个文件或是目录
031
  
032
 matches="$(ls *"$1" 2> /dev/null | wc -l)"
033
  
034
 if [ $matches -eq 0 ]; then
035
     echo "No match for \"$1\" in the deleted file archive." >&2
036
     exit 1
037
 fi
038
  
039
 if [ $matches -gt 1 ]; then
040
     echo "More than one file or directory match in the archive:"
041
     index=1
042
     # ls中的-t是按照最近修改时间显示
043
     # ls中的-d是只显示目录的名字,而不是显示目录中的内容
044
     for name in $(ls -td *"$1")
045
     do
046
         datetime="$(echo $name | cut -c1-14 | \
047
             awk -F. '{print $5"/"$4" at "$3":"$2":"$1}')"  # 使用awk格式化输出
048
         if [ -d $name ]; then
049
             size="$(ls $name | wc -l | sed 's/[^[:digit:]]//g')"    # 算出$name这个目录中文件的数目
050
             echo "$index) $1 (contents = ${size} itmes, deleted = $datetime)"
051
         else
052
             size="$(ls -sdk1 $name | awk '{print $1}')"    # 计算文件的大小
053
             echo "$index) $1 (size = ${size}Kb, deleted = $datetime)"
054
         fi
055
         index=$(($index+1))
056
     done
057
     echo ""
058
     echo -n "Which version of $1 do you want to restore ('0' to quit)? [1]: "
059
     read desired
060
     if [ ${desired:=1} -ge $index ]; then
061
         echo "$(basename $0): Restore canceled by user: index value too big." >&2
062
         exit 1
063
     fi
064
  
065
     if [ $desired -lt 1 ]; then
066
         echo "$(basename $0): canceled by user." >& 2
067
         exit 1
068
     fi
069
  
070
     restore="$(ls -td1 *"$1" | sed -n "${desired}p")"
071
  
072
     if [ -e "$dest/$1" ]; then
073
         echo "\"$1\" already exists in this directory. Cannot overwrite." >&2
074
         exit 1
075
     fi
076
  
077
     echo -n "Restoring file \"$1\"..."
078
     $move "$restore" "$dest/$1"
079
     echo "done."
080
  
081
     echo -n "Delete the additional copies of this file? [y]: "
082
     read answer
083
  
084
     if [ ${answer:=y} = "y" ]; then
085
         $realrm -rf *"$1"
086
         echo "deleted"
087
     else
088
         echo "additional copies retained."
089
     fi
090
 else
091
     if [ -e "$dest/$1" ]; then
092
         echo "\"$1\" already exists in this directory. Cannot Overwrite." >&2
093
         exit 1
094
     fi
095
  
096
     restore="$(ls -d *"$1")"
097
  
098
     echo -n "Restoring file \"$1\"..."
099
     $move "$restore" "$dest/$1"
100
     echo "done."
101
 fi
102
  
103
 exit 0
脚本如何工作:
第一个大段的代码,if [ $# -eq 0 ]条件语块,会按此执行:如果没有参数给定,那么就列出删除文档中的所有内容。但这里有个地方隐瞒了。我们并不能展示真实的文件名,因为我们并不想用户看到时间戳,这些时间戳只是用来在内部保护文件名之间并不会相互冲突用的。为了用一种更美观方式展示文件名,sed表达式删除了开始的5个数字段。如果给定了一个参数,它就是要恢复的文件名或是目录了。下一步就是要查明有多少个能匹配给定的名称。下面的语句完成了这个功能:
1
matches="$(ls *"$1" 2> /dev/null | wc -l)"
在ls的参数中有对不常用的引号,它们是用来保证该模式会匹配到已嵌入空白的文件名,而通配符'*'则被shell适当的扩展了。而2> /dev/null保住了命令中产生的错误信息会被抛弃掉,不会让它们显示给用户看到。丢弃的信息绝大部分有可能是No such file or directory,一般都是由于没找到给定的文件名引起的。如果对给定的文件或是目录名有多个匹配,最复杂的脚本部分,就是if [ $matches -gt 1 ]语块。这个语块,展示了所有的结果。在for循环中的ls命令中使用-t选项,会将文档按照从新到旧排序显示。然后的awk语句将文件名中的时间戳给分割了开来。下面的ls中内含的-k选项是用来计算文件大小时使用千字节(kb)作为单位,而不是平时的字节。
1
size="$(ls -sdk1 $name | awk '{print $1}')"
脚本会在每个匹配的目录中显示文件的数目,而不是毫无意义的只是显示匹配文件项的大小。一个目录中项的数目事实上很容易计算,使用wc命令:
1
size="$(ls $name | wc -l | sed 's/[^[:digit:]]//g')"
一旦用户给定一种可能的匹配文件或是目录,对应的扩展名就会被下面的语句定义好:
1
restore="$(ls -td1 *"$1" | sed -n "${desired}p")"
这个句子包含了一点sed的另类用法。使用-n选项,然后是一个跟着打印命令p的数字(${desired}),这种方法可以很快的从输入流中提取给定行号的行。 
运行脚本: 
有两种方法调用脚本。第一种,无参数,它会显示删除文档中所有的文件和目录。第二种,有一个要求的文件或是目录名作为参数,脚本要么会恢复该文件或是目录(如果只有一个匹配),要么会显示可以恢复的所有的候选名单,这样用户就可以自行选定一个。 
运行结果: 
无参数时,脚本会显示所有的删除文档: 
1
unrm.sh
2
Contents of your deleted files archive(sorted by data):
3
.a.txt  .a.o*  .adir/
有一个文件名做参数:
1
unrm.sh a.txt
2
 More than one file or directory match in the archive:
3
 1) a.txt (size = 4Kb, deleted = 11/18 at 17:15:45)
4
 2) a.txt (size = 4Kb, deleted = 11/18 at 17:15:10)
5
  
6
 Which version of a.txt do you want to restore ('0' to quit)? [1] 2
7
 Restoring file "a.txt"...done.
8
 Delete the additional copies of this file? [y] y
9
 deleted
分析脚本: 
如果你执行这个脚本,那么就有一个潜在的危险需要注意。没有任何控制或是限制的话,在删除文档中的文件或是目录会无限制增加。为了避免这点,可以添加一个cronjob来减少文档。保留14天内的文档应当时比较合理的了。 
 

相关内容

    暂无相关文章