Linux用户应知的高效率的技巧


Unix/Linux下,最有效率技巧的不是操作图形界面,而是命令行操作,因为命令行意味着自动化。

日常

  • 在 bash 里,使用 Ctrl-R 而不是上下光标键来查找历史命令。
    • 在 bash里,使用 Ctrl-W 来删除最后一个单词,使用 Ctrl-U 来删除一行。请man bash后查找Readline Key Bindings一节来看看bash的默认热键,比如:Alt-. 把上一次命令的最后一个参数打出来,而Alt-* 则列出你可以输入的命令。
      • 回到上一次的工作目录: cd – (回到home是 cd ~)
        • 使用 xargs。这是一个很强大的命令。你可以使用-L来限定有多少个命令,也可以用-P来指定并行的进程数。如果你不知道你的命令会变成什么样,你可以使用xargs echo来看看会是什么样。当然, -I{} 也很好用。示例:
          find. -name \*.py | xargsgrep some_function
           
          cathosts | xargs-I{} sshroot@{} hostname

          pstree -p 可以帮你显示进程树。
          • 使用 pgrep 和 pkill 来找到或是kill 某个名字的进程。 (-f 选项很有用).
            • 了解可以发给进程的信号。例如:要挂起一个进程,使用 kill -STOP [pid]. 使用 man 7 signal 来查看各种信号,使用kill -l 来查看数字和信号的对应表
              • 使用 nohup 或 disown 如果你要让某个进程运行在后台。
                • 使用netstat -lntp来看看有侦听在网络某端口的进程。当然,也可以使用 lsof。
                  • 在bash的脚本中,你可以使用 set -x 来debug输出。使用 set -e 来当有错误发生的时候abort执行。考虑使用 set -o pipefail 来限制错误。还可以使用trap来截获信号(如截获ctrl+c)。
                    • 在bash 脚本中,subshells (写在圆括号里的) 是一个很方便的方式来组合一些命令。一个常用的例子是临时地到另一个目录中,例如:
                      (cd/some/other/dir; other-command)
                      # continue in original dir
                      • 在 bash 中,注意那里有很多的变量展开。如:检查一个变量是否存在: ${name:?error message}。如果一个bash的脚本需要一个参数,也许就是这样一个表达式 input_file=${1:?usage: $0 input_file}。一个计算表达式: i=$(( (i + 1) % 5 ))。一个序列: {1..10}。 截断一个字符串: ${var%suffix} 和 ${var#prefix}。 示例: if var=foo.pdf, then echo ${var%.pdf}.txt prints “foo.txt”.
                        • 通过 <(some command) 可以把某命令当成一个文件。示例:比较一个本地文件和远程文件 /etc/hosts: diff /etc/hosts <(ssh somehost cat /etc/hosts)
                          • 了解什么叫 “here documents” ,就是诸如 cat <<EOF 这样的东西。
                            • 在 bash中,使用重定向到标准输出和标准错误。如: some-command >logfile 2>&1。另外,要确认某命令没有把某个打开了的文件句柄重定向给标准输入,最佳实践是加上 “</dev/null”,把/dev/null重定向到标准输入。
                              • 使用 man ascii 来查看 ASCII 表。
                                • 在远端的 ssh 会话里,使用 screen 或 dtach 来保存你的会话。
                                  • 要来debug Web,试试curl 和 curl -I 或是 wget 。我觉得debug Web的利器是firebug,curl和wget是用来抓网页的,呵呵。
                                    • 把 HTML 转成文本: lynx -dump -stdin
                                      • 如果你要处理XML,使用 xmlstarlet
                                        • 对于 Amazon S3, s3cmd 是一个很方便的命令(还有点不成熟)
                                          • 在 ssh中,知道怎么来使用ssh隧道。通过 -L or -D (还有-R) ,翻墙神器。
                                            • 你还可以对你的ssh 做点优化。比如,.ssh/config 包含着一些配置:避免链接被丢弃,链接新的host时不需要确认,转发认证,以前使用压缩(如果你要使用scp传文件):
                                              TCPKeepAlive=yes
                                              ServerAliveInterval=15
                                              ServerAliveCountMax=6
                                              StrictHostKeyChecking=no
                                              Compression=yes
                                              ForwardAgent=yes
                                              • 如果你有输了个命令行,但是你改变注意了,但你又不想删除它,因为你要在历史命令中找到它,但你也不想执行它。那么,你可以按下 Alt-# ,于是这个命令关就被加了一个#字符,于是就被注释掉了。

                                                数据处理

                                                • 了解 sort 和 uniq 命令 (包括 uniq 的 -u 和 -d 选项).
                                                  • 了解用 cut, paste, 和 join 命令来操作文本文件。很多人忘了在cut前使用join。
                                                    • 如果你知道怎么用sort/uniq来做集合交集、并集、差集能很大地促进你的工作效率。假设有两个文本文件a和b已解被 uniq了,那么,用sort/uniq会是最快的方式,无论这两个文件有多大(sort不会被内存所限,你甚至可以使用-T选项,如果你的/tmp目录很小)
                                                      cata b | sort| uniq> c   # c is a union b 并集
                                                       
                                                      cata b | sort| uniq-d > c   # c is a intersect b 交集
                                                       
                                                      cata b b | sort| uniq-u > c   # c is set difference a - b 差集
                                                      

                                                      • 了解和字符集相关的命令行工具,包括排序和性能。很多的Linux安装程序都会设置LANG 或是其它和字符集相关的环境变量。这些东西可能会让一些命令(如:sort)的执行性能慢N多倍(注:就算是你用UTF-8编码文本文件,你也可以很安全地使用ASCII来对其排序)。如果你想Disable那个i18n 并使用传统的基于byte的排序方法,那就设置export LC_ALL=C (实际上,你可以把其放在 .bashrc)。如果这设置这个变量,你的sort命令很有可能会是错的。
                                                        • 了解 awk 和 sed,并用他们来做一些简单的数据修改操作。例如:求第三列的数字之和: awk ‘{ x += $3 } END { print x }’。这可能会比Python快3倍,并比Python的代码少三倍。
                                                          • 使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。
                                                            • 了解sort命令的选项。了解key是什么(-t和-k)。具体说来,你可以使用-k1,1来对第一列排序,-k1来对全行排序。
                                                              • Stable sort (sort -s) 会很有用。例如:如果你要想对两例排序,先是以第二列,然后再以第一列,那么你可以这样: sort -k1,1 | sort -s -k2,2
                                                                • 我们知道,在bash命令行下,Tab键是用来做目录文件自动完成的事的。但是如果你想输入一个Tab字符(比如:你想在sort -t选项后输入<tab>字符),你可以先按Ctrl-V,然后再按Tab键,就可以输入<tab>字符了。当然,你也可以使用$’\t’。
                                                                  • 如果你想查看二进制文件,你可以使用hd命令(在CentOS下是hexdump命令),如果你想编译二进制文件,你可以使用bvi命令
                                                                    • 另外,对于二进制文件,你可以使用strings(配合grep等)来查看二进制中的文本。
                                                                      • 对于文本文件转码,你可以试一下 iconv。或是试试更强的 uconv 命令(这个命令支持更高级的Unicode编码)
                                                                        • 如果你要分隔一个大文件,你可以使用split命令(split by size)和csplit命令(split by a pattern)。

                                                                          系统调试

                                                                          • 如果你想知道磁盘、CPU、或网络状态,你可以使用 iostat, netstat, top (或更好的 htop), 还有 dstat 命令。你可以很快地知道你的系统发生了什么事。关于这方面的命令,还有iftop, iotop等
                                                                            • 要了解内存的状态,你可以使用free和vmstat命令。具体来说,你需要注意 “cached” 的值,这个值是Linux内核占用的内存。还有free的值。
                                                                              • Java 系统监控有一个小的技巧是,你可以使用kill -3 <pid> 发一个SIGQUIT的信号给JVM,可以把堆栈信息(包括垃圾回收的信息)dump到stderr/logs。
                                                                                • 使用 mtr 会比使用 traceroute 要更容易定位一个网络问题。
                                                                                  • 如果你要找到哪个socket或进程在使用网络带宽,你可以使用 iftop 或 nethogs。
                                                                                    • Apache的一个叫 ab 的工具是一个很有用的,用quick-and-dirty的方式来测试网站服务器的性能负载的工作。如果你需要更为复杂的测试,你可以试试 siege。
                                                                                      • 如果你要抓网络包的话,试试 wireshark 或 tshark。
                                                                                        • 了解 strace 和 ltrace。这两个命令可以让你查看进程的系统调用,这有助于你分析进程的hang在哪了,怎么crash和failed的。你还可以用其来做性能profile,使用 -c 选项,你可以使用-p选项来attach上任意一个进程。
                                                                                          • 了解用ldd命令来检查相关的动态链接库。
                                                                                            • 使用gdb来调试一个正在运行的进程或分析core dump文件。
                                                                                              • 学会到 /proc 目录中查看信息。这是一个Linux内核运行时记录的整个操作系统的运行统计和信息,比如: /proc/cpuinfo, /proc/xxx/cwd, /proc/xxx/exe, /proc/xxx/fd/, /proc/xxx/smaps.
                                                                                                • 如果你调试某个东西为什么出错时,sar命令会有用。它可以让你看看 CPU, 内存, 网络, 等的统计信息。
                                                                                                  • 使用 dmesg 来查看一些硬件或驱动程序的信息或问题。

                                                                                                  • 高效命令

                                                                                                    • ‘ALT+.’ or ‘<ESC> .’
                                                                                                      热建alt+. 或 esc+. 可以把上次命令行的参数给重复出来。
                                                                                                      • ^old^new
                                                                                                        替换前一条命令里的部分字符串。
                                                                                                        场景:echo "wanderful",其实是想输出echo "wonderful"。只需要^a^o就行了,对很长的命令的错误拼写有很大的帮助。(陈皓注:也可以使用 !!:gs/old/new)
                                                                                                        • du -s * | sort -n | tail
                                                                                                          列出当前目录里最大的10个文件。
                                                                                                          • :w !sudo tee %
                                                                                                            在vi中保存一个只有root可以写的文件
                                                                                                            • date -d@1234567890
                                                                                                              时间截转时间
                                                                                                              • > file.txt
                                                                                                                创建一个空文件,比touch短。
                                                                                                                • mtr coolshell.cn
                                                                                                                  mtr命令比traceroute要好。
                                                                                                                  • 在命令行前加空格,该命令不会进入history里。
                                                                                                                    • echo “ls -l” | at midnight
                                                                                                                      在某个时间运行某个命令。
                                                                                                                      • curl -u user:pass -d status=”Tweeting from the shell” http://twitter.com/statuses/update.xml
                                                                                                                        命令行的方式更新twitter。
                                                                                                                        • curl -u username –silent “https://mail.google.com/mail/feed/atom” | perl -ne ‘print “\t” if /<name>/; print “$2\n” if /<(title|name)>(.*)<\/\1>/;’
                                                                                                                          检查你的gmail未读邮件
                                                                                                                          • ps aux | sort -nk +4 | tail
                                                                                                                            列出头十个最耗内存的进程
                                                                                                                            • man ascii
                                                                                                                              显示ascii码表。
                                                                                                                              场景:忘记ascii码表的时候还需要google么?尤其在天朝网络如此“顺畅”的情况下,就更麻烦在GWF多应用一次规则了,直接用本地的man ascii吧。
                                                                                                                              • ctrl-x e
                                                                                                                                快速启动你的默认编辑器(由变量$EDITOR设置)。
                                                                                                                                • netstat –tlnp
                                                                                                                                  列出本机进程监听的端口号。(陈皓注:netstat -anop 可以显示侦听在这个端口号的进程)
                                                                                                                                  • tail -f /path/to/file.log | sed '/^Finished: SUCCESS$/ q'
                                                                                                                                    当file.log里出现Finished: SUCCESS时候就退出tail,这个命令用于实时监控并过滤log是否出现了某条记录。
                                                                                                                                    • ssh user@server bash < /path/to/local/script.sh
                                                                                                                                      在远程机器上运行一段脚本。这条命令最大的好处就是不用把脚本拷到远程机器上。
                                                                                                                                      • ssh user@host cat /path/to/remotefile | diff /path/to/localfile -
                                                                                                                                        比较一个远程文件和一个本地文件
                                                                                                                                        • net rpc shutdown -I ipAddressOfWindowsPC -U username%password
                                                                                                                                          远程关闭一台Windows的机器
                                                                                                                                          • screen -d -m -S some_name ping my_router
                                                                                                                                            后台运行一段不终止的程序,并可以随时查看它的状态。-d -m参数启动“分离”模式,-S指定了一个session的标识。可以通过-R命令来重新“挂载”一个标识的session。更多细节请参考screen用法 man screen。
                                                                                                                                            • wget --random-wait -r -p -e robots=off -U mozilla http://www.example.com
                                                                                                                                              下载整个www.example.com网站。(注:别太过分,大部分网站都有防爬功能了:))
                                                                                                                                              • curl ifconfig.me
                                                                                                                                                当你的机器在内网的时候,可以通过这个命令查看外网的IP。
                                                                                                                                                • convert input.png -gravity NorthWest -background transparent -extent 720×200 output.png
                                                                                                                                                  改一下图片的大小尺寸
                                                                                                                                                  • lsof –i
                                                                                                                                                    实时查看本机网络服务的活动状态。
                                                                                                                                                    • vim scp://username@host//path/to/somefile
                                                                                                                                                      vim一个远程文件
                                                                                                                                                      • python -m SimpleHTTPServer
                                                                                                                                                        一句话实现一个HTTP服务,把当前目录设为HTTP服务目录,可以通过http://localhost:8000访问 这也许是这个星球上最简单的HTTP服务器的实现了。
                                                                                                                                                        • history | awk '{CMD[$2]++;count++;} END { for (a in CMD )print CMD[a] " " CMD[a]/count*100 "% " a }' | grep -v "./" | column -c3 -s " " -t | sort -nr | nl | head -n10
                                                                                                                                                          (陈皓注:有点复杂了,history|awk ‘{print $2}’|awk ‘BEGIN {FS=”|”} {print $1}’|sort|uniq -c|sort -rn|head -10)
                                                                                                                                                          这行脚本能输出你最常用的十条命令,由此甚至可以洞察你是一个什么类型的程序员。
                                                                                                                                                          • tr -c “[:digit:]” ” ” < /dev/urandom | dd cbs=$COLUMNS conv=unblock | GREP_COLOR=”1;32″ grep –color “[^ ]“
                                                                                                                                                            想看看Marix的屏幕效果吗?

相关内容