*usr_27.txt* For Vim version 6.4. 最近更新:2005年3月VIM 用户手册 - Bram Moolenaar 著
译者
: Chimin Yen http://vimcdoc.sf.net 查找命令及模式 在第三章里,我们曾经提到过几个简单的查找模式 |03.9|。Vim 能够胜任复杂得多的查 找。本章将解释那些最常用到的模式。详细的说明可以查阅: |pattern| |27.1| 忽略大小写 |27.2| 在文件尾折返 |27.3| 偏移 |27.4| 匹配重复性模式 |27.5| 多择一 |27.6| 字符域 |27.7| 字符类 |27.8| 匹配换行符 |27.9| 举例 下一章: |usr_28.txt| 折叠 前一章: |usr_26.txt| 重复 目录: |usr_toc.txt|
*27.1* 忽略大小写
默认情况下,Vim 的查找是大小写敏感的。因此,"include","INCLUDE",和 "Include" 为三个各不相同的词,而一次查找将仅仅匹配其中的一个。 现在设定 'ignorecase' 选项:
:set ignorecase
再查找 "include",现在它将匹配 "Include","INCLUDE" 和 "InClUDe"。(设定 'hlsearch' 选项可以快速查看哪儿有模式的匹配。) 你可以这样撤销这个选项:
:set noignorecase
但是我们且保留这个设定,并查找 "INCLUDE"。它匹配的文本就跟查找 "include" 时 一模一样。现在我们设定 'smartcase' 选项:
:set ignorecase smartcase
如果你采用的模式里至少有一个大写字母,查找就成了大小写敏感的。可以这样理解,你 不必键入大写字母,也能查找到含有大写字母的词,所以,你若键入大写字母,必然是因 为你要大小写敏感的匹配。聪明! 设定了这两个选项,你会找到以下匹配:
模式 匹配
word word,Word,WORD,WoRd,等。 Word Word WORD WORD WoRd WoRd 单 个 模 式 里 的 大 小 写 如果你仅想忽略一个特定的模式里的大小写,那么,在模式前添加 "\c" 字符串就行了。 添加 "\C" 将使该模式的匹配大小写敏感。这排除了 'ignorecase' 和 'smartcase' 选项的影响,当 "\c" 或 "\C" 起作用时,它们设成什么值无关紧要。模式 匹配
\Cword word \CWord Word \cword word,Word,WORD,WoRd,等。 \cWord word,Word,WORD,WoRd,等。 采用 "\c" 和 "\C" 的好处在于它粘附在所用的模式上。因此,重复查找历史记录里的某个模式会产生同样 的结果。'ignorecase' 或 'smartcase' 是否更改部影响结果。备注
: 在查找模式中使用以 "\" 开头的项,其效果取决于 'magic' 选项。在本章中, 我们将假定 'magic' 为真。这也是标准和建议的设定。如果你把它改了, 那么,许多查找模式就会突然变得无效了。备注
: 如果你查了好久,超过了你预计的时间,你可以中断查找,在 Unix 上用CTRL-C
,而在 MS-DOS 和微软视窗上则用CTRL-Break
。
*27.2* 在文件尾折返
在默认情况下,正向查找从当前光标位置开始,查找特定的字符串。然后它就遇到了文 件尾。如果那个时候还没找到那个字符串,它就从头来过,从文件开头一直查到光标处。 记住,当你不断以 "n" 命令查找下一个匹配时,你最终回到第一个匹配。如果你不注意
,你将永远找下去! 为了提醒你,Vim 显示如下信息:search hit BOTTOM,continuing at TOP
如果你使用 "?" 命令按相反方向查找,你得到的信息是这样的:search hit TOP,continuing at BOTTOM
可是,你还是不知道你何时回到了第一个匹配。一种办法是设定 'ruler' 选项:
:set ruler
Vim 将把光标位置显示在窗口的右下角 (如果使用了状态条的话,会显示在哪里)。看起 来像这样:
101,29 84%
第一个数字是光标所在的行号。在你开始查找的时候记住行号,那样你就能检查是否越 过了该位置。 无 折 返 查 找 要取消查找折返功能,请用以下命令:
:set nowrapscan
现在当查找遇到文件末尾,一个出错信息就会显示出来:
E385: search hit BOTTOM without match for: forever
这样,你只要用 "gg" 命令回到文件开头,并一直查到你看到以上信息,你就能找到所 有的匹配。 如果你用 "?" 从相反方向查找,你将得到:E384: search hit TOP without match for: forever
*27.3* 偏移
在默认情况下,查找命令让光标停留在匹配的模式的开始。你可以指定一个偏移,告诉 Vim 将光标停留在别的位置上。在正向查找命令 "/" 中指定偏移,就是在模式后面附加 一个斜线符 (/) 以及偏移值:
/默认/2
这个命令查找模式 "默认"。找到后使光标越过匹配的模式而前移两行,并停留在该行的 行首。把这个命令用于以上段落中,Vim 在第一行找到词 "默认"。接着光标再往下移两行, 落在 "一个" 的 "一" 上。 如果该偏移为一简单数字,那么光标就会被放置在距离匹配那么多行的那一行的行首。 该偏移值可为正数或负数。如果它是正数,光标会向前移该数表示的行; 若为负数,则往 回退该数表示的行。 字 符 偏 移 偏移符 "e" 表示一个偏移从匹配末尾算起。它把光标移到匹配的最后一个字符上。命令:
/const/e
把光标放到单词 "const" 的 "t" 上。 加一个数字,光标就从该位置再前移该数字指定的那么多个字符。下面这个命令会将 光标移到匹配后面第一个字符:
/const/e+1
一个正数使光标右移,负数使其左移。例如:
/const/e-1
会把光标移到单词 "const" 的 "s" 字符上。 如果偏移以 "b" 开头,那么光标就移到匹配模式的首位。因为不用 "b" 光标也一样会被 移到首位,所以单独使用时没什么意义。在将它与一个加上或减去的数字合起来时,就很 有用了。光标就会前移或后移那么多个字符。例如:
/const/b+2
会把光标移到匹配的首位,再往右移两个字符。因而落在字符 "n" 上。 重 复 当你重复前一次使用过的查找模式,只是偏移不同时,你可以把模式省略了:
/that
//e
等于:
/that/e
再以同样的偏移重复查找:
/
命令 "n" 具有同样的作用。要取消一个以前用过的偏移可以用:
//
反 向 查 找 命令 "?" 以相同的方式使用偏移,但你必须以 "?" 来分隔模式和偏移,而非 "/":
?const?e-2
偏移符 "b" 和 "e" 的用途是一样的。它们并不因为使用了 "?" 而改变方向。 起 始 位 置 查找时,通常从光标位置开始。当你规定的是一个行偏移,这可能造成麻烦。例如:
/const/-2
这个命令找到下一个单词 "const",然后上移两行。如果你用命令 "n" 再找,Vim 就 从当前位置开始,找到同一个 "const" 匹配。然后再一次在偏移的作用下,回到开始 的地方。你给套住了! 还有比这更糟糕的: 假定下一行另有一个 "const" 匹配。那么,重复正向查找就会 找到这个匹配,并上移两行。这样你实际上把光标往回移了! 当你规定的是一个字符偏移,Vim 将为其作调整。因此,查找会向前或向后跳过几个字 符再开始,以便同一个匹配不至于再出现。
*27.4* 匹配重复性模式
星号项 "*" 规定在它前面的项可以重复任意次。因此:
/a*
匹配 "a","aa","aaa",等等。但也匹配 "" (空字串),因为零次也包含在内。 星号 "*" 仅仅应用于那个紧邻在它前面的项。因此 "ab*" 匹配 "a","ab","abb", "abbb",等等。如要多次重复整个字符串,那么该字符串必须被组成一个项。组成一项的 方法就是在它前面加 "\(",后面加 "\)"。因此这个命令:
/\(ab\)*
匹配: "ab","abab","ababab",等等。而且也匹配 ""。 要避免匹配空字串,使用 "\+"。这表示前面一项可以被匹配一次或多次。
/ab\+
匹配 "ab","abb","abbb",等等。它不匹配 后面没有跟随 "b" 的 "a"。 要匹配一个可选项,用 "\="。 例如:
/folders\=
匹配 "folder" 和 "folders"。 指 定 重 复 次 数 要匹配某一项的特定次数重复,使用 "\
{n,m}
" 这样的形式。其中 "n" 和 "m" 都是数字。 在它前面的那个项将被重复 "n" 到 "m" 次 (|inclusive| 包含 "n" 和 "m")。例如:
/ab\
{3,5}
匹配 "abbb","abbbb" 以及 "abbbbb"。 当 "n" 省略时,被默认为零。当 "m" 省略时,被默认为无限大。当 ",m" 省略 时,就表示重复正好 "n" 次。例如:
模式 匹配次数
\{,4}
0,1,2,3 或 4 \{3,}
3,4,5,等等 \{0,1}
0 或 1,同 \= \{0,}
0 或 更多,同 * \{1,}
1 或 更多,同 \+ \{3}
3 匹配尽可能少的字符 迄今为止,我们所讨论过的都试图匹配尽可能多的字符。若要匹配尽可能少的字符,请 用 "\{-n,m}
"。它的用法跟 "\{n,m}
" 一样,唯一的区别在于,它采用尽可能少的字符。 例如,以下命令:
/ab\
{-1,3}
将匹配 "abbb" 中的 "ab"。实际上,因为没理由匹配更多,所以它永远不会匹配超过 一个 b。它需要其它的来强制它超过其下限规定次数,而匹配更多的重复。 这些同样的规则也适用于省略 "n" 和 "m" 的情形。甚至可以把两个都省略,只剩 "\
{-}
"。这个项匹配其前项的重复,重复次数尽可能少,可以等于或大于零。这个项如 单独使用,则总是匹配前项的零次重复。当它跟与其它的模式合起来时,用处就大了。 例如:
/a.\
{-}
b这个命令匹配 "axbxb" 中的 "axb"。如果采用了下面这个模式:
/a.*b
由于 ".*" 匹配尽可能多的字符,整个 "axbxb" 都会被匹配。
*27.5* 多择一
在一个查找模式中,"或" 运算符是 "\|"。例如:
/foo\|bar
这个命令匹配了 "foo" 或 "bar"。更多的抉择可以连在后面:
/one\|
two\
|three匹配 "one","two" 或 "three"。 如要匹配其多次重复,那么整个抉择结构须置于 "\(" 和 "\)" 之间:
/\(foo\|bar\)\+
这个命令匹配 "foo","foobar","foofoo","barfoobar",等等。 再举个例子:
/end\(if\|
while\
|for\)这个命令匹配 "endif","endwhile" 和 "endfor"。 一个与此相关的项是 "\&"。它要求两个抉择都与同一位置的文本相符。而最终匹配的则 是最后面的那个抉择。例如:
/forever\&...
这个命令匹配 "forever" 中的 "for" (
译者
: 因为第二抉择要求三个字符)。它将不匹 配,比如说 "fortuin" (译者
: 不符合第一抉择)。
*27.6* 字符域
你可以用 "/a\|b\
|c" 来匹配 "a","b" 或 "c"。当你需要匹配自 "a" 至 "z" 所有的 字母时,以这样的方式表达就嫌长了。这里有个比较简短的表达方式:
/[a-z]
方括号结构 [] 匹配单个字符。你在括号内指定哪些字符可以匹配。你可以把一系列字 符包含在内,像这样:
/[0123456789abcdef]
这个命令将匹配其中的任何一个字符。你可以为一系列连续字符规定一个字符域。"0-3" 表示 "0123"。"w-z" 表示 "wxyz"。因此,上面那个命令可以缩短为:
/[0-9a-f]
若要匹配字符 "-" 本身,就得把它放在字符域的第一或最后的位置上。Vim 会识别下面这 些特殊字符,以便在 [] 字符域里使用它们较为方便 (它们实际上可被用于任何查找模 式的任何地方): \e
<Esc>
\t<Tab>
\r<CR>
\b<BS>
还有若干特殊场合用得上 [] 字符域,参阅 |/[]| 以了解全部用法。 补 域 为了避免匹配到一个特定的字符,在字符域首位使用 "^"。这样方括号项 [] 就会匹配 任何括号内不包括的字符。例如:
/"[^"]*"
" 双引号 [^"] 双引号以外的任何字符 * 尽可能多个 " 又一个双引号 这个命令匹配 "foo" 和 "3!x",包含双引号在内。 预 定 义 的 域 有些字符域使用得很频繁。Vim 为这些字符域提供了一些捷径。例如:
/\a
这个命令找寻字母字符。这相当于使用 "/[a-zA-Z]"。下面还有几个这样的字符域:
项 匹配 相当于
\d 数码 [0-9] \D 非数码 [^0-9] \x 十六进制数 [0-9a-fA-F] \X 非十六进制数 [^0-9a-fA-F] \s 空白字符 [ ] (<Tab>
和<Space>
) \S 非空白字符 [^ ] (非<Tab>
和<Space>
) \l 小写字母 [a-z] \L 非小写字母 [^a-z] \u 大写字母 [A-Z] \U 非大写字母 [^A-Z]备注
: 使用这些预定义的字符域要比使用它们所表示的那个字符域快很多。 这些项不能用于 [] 方括号内。因此 "[\d\l]" 不能用来匹配一个数字或一个 小写字母。请换用 "\(\d\|\l\)"。 |/\s| 包括一个这类域的完整的列表。
*27.7* 字符类
一个特定的字符域匹配一组固定的字符。一个字符类与字符域相似,不过有个本质的区 别: 一个字符类代表的那组字符可以重新定义而无须改动查找模式。 例如,查找这个模式:
/\f\+
其中 "\f" 项表示文件名字符。因而这个命令匹配一个由可用作文件名的字符字符组成 的序列。 哪些字符可以用来组成文件名取决于你所使用的系统。在微软视窗上,反斜线符可 以,而在 Unix 上却不行。文件名字符由 'isfname' 选项来规定。在 Unix 上,该选项的默认值为:
:set isfname
isfname=@,48-57,/,.,-,_,+,,,#,$,%,~,=
在其它系统上,其默认值各不相同。因此你可以用 "\f" 组成一个查找模式,以匹配一 个文件名。该查找模式将自动调整以适应你所使用的系统。
备注
: 实际上,Unix 允许在文件名里使用几乎所有的字符,包括空格字符。把这些字 符包括在 'isfname' 里,在理论上是没错的。但那样就无法在文本中发现一个 文件名在哪儿结束。因此选项 'isfname' 的默认值是个折衷方案。 字符类有如下这些:项 匹配 选项
\i 标识符字符 'isident' \I 类似于 \i,但不包括数字 \k 关键词字符 'iskeyword' \K 类似于 \k,但不包括数字 \p 可打印字符 'isprint' \P 类似于 \p,但不包括数字 \f 文件名字符 'isfname' \F 类似于 \f,但不包括数字
*27.8* 匹配换行符
Vim 能找寻含有换行符的模式。你需要指定换行符在哪儿出现,因为迄今为止所有我们 曾经提到过的项,都不匹配换行符。 用 "\n" 项可以在一个特定的位置查验一个换行符:
/the\nword
这个命令将在一行以 "the" 结尾,而下一行以 "word" 开头的地方找到匹配。如果还 要匹配 "the word",那么你需要匹配一个空格或一个换行符。这可以用 "\_s" 表示:
/the\_sword
若要允许任意数量的空格:
/the\_s\+word
这个命令也匹配 "the " 在行尾,及 " word" 在下一行行首的情形。 "\s" 匹配空格字符,"\_s" 匹配空格字符或一个换行符。同理,"\a" 匹配一个字母字 符,而 "\_a" 匹配一个字母字符或一个换行符。其它字符类和字符域都可以通过插入一 个 "_" 来更改其范围。 很多别的项也可以在前面加 "\_" 以匹配一个换行符。例如: "\_." 匹配任意字符或一 个换行符。
备注
: "\_.*" 匹配任何字符,直至文件结束。要小心,它会使查找命令执行得非常缓慢。 另一个例子是 "\_[]",一个包含了换行符的字符域:
/"\_[^"]*"
这个命令找寻位于一对双引号之间,可能分隔成数行的文本。
*27.9* 举例
这儿有几个查找模式,你也许会觉得有用。本节向你演示如何综合使用前面提及的那些 用法。 寻 找 一 个 加 州 驾 驶 牌 照 有一个驾驶牌照号码为 "1MGU103"。它有一个数字,三个大写字母,然后三位数字。直 接把这个号码放入查找模式:
/\d\u\u\u\d\d\d
另一种方法是用一个计数器来指定其中有三个数字和三个字母:
/\d\u\
{3}
\d\{3}
换用 [] 字符域方法:
/[0-9][A-Z]\
{3}
[0-9]\{3}
这些方法之中你应该使用哪一种? 挑那种你记得住的。你记得住的简单方法要比你记不 住的华丽方法快得多。如果你能把它们都记住,那么避免使用最后那种,因为它要打的 字多,而且执行起来慢。 寻 找 一 个 标 识 符 在 C 程序里 (以及其它很多计算机程序) 一个标识符以字母开头,其余部分由字母和数 字组成。下划线字符也可以。这样一个标识符可以用下面的命令找到:
/\
<\h\w*\>
"\
<" 和 "\>
" 用来寻找那些完整的词。"\h" 表示 "[A-Za-z_]",而 "\w" 则表示 [0-9A-Za-z_]"。备注
: "\<" 和 "\>
" 取决于 'iskeyword' 选项。如果这个选项包括 "-" 的话,那么 "ident-" 就不匹配了。在这种情况下,请用:
/\w\@<!\h\w*\w\@!
这个命令查验是否 "\w" 不匹配标识符之前或之后的字符。 参见 |/\@<!| 和 |/\@!|。
下一章: |usr_28.txt| 折叠 版权: 参见 |manual-copyright| vim:tw=78:ts=8:ft=help:norl:
Generated by vim2html on 2006年 07月 02日 星期日 22:43:25 UTC