VIM: usr

USR_27

*usr_27.txt*    For Vim version 6.4.    最近更新：2005年3月

                     VIM 用户手册 - Bram Moolenaar 著
                  译者： Chimin Yen http://vimcdoc.sf.net

                             查找命令及模式


在第三章里，我们曾经提到过几个简单的查找模式 |03.9|。Vim 能够胜任复杂得多的查
找。本章将解释那些最常用到的模式。详细的说明可以查阅: |pattern|

|27.1|  忽略大小写
|27.2|  在文件尾折返
|27.3|  偏移
|27.4|  匹配重复性模式
|27.5|  多择一
|27.6|  字符域
|27.7|  字符类
|27.8|  匹配换行符
|27.9|  举例

       下一章: |usr_28.txt|  折叠
       前一章: |usr_26.txt|  重复
         目录: |usr_toc.txt|

*27.1*  忽略大小写
默认情况下，Vim 的查找是大小写敏感的。因此，"include"，"INCLUDE"，和 "Include"
为三个各不相同的词，而一次查找将仅仅匹配其中的一个。
   现在设定 'ignorecase' 选项:

        :set ignorecase

再查找 "include"，现在它将匹配 "Include"，"INCLUDE" 和 "InClUDe"。(设定
'hlsearch' 选项可以快速查看哪儿有模式的匹配。)
   你可以这样撤销这个选项:

        :set noignorecase

但是我们且保留这个设定，并查找 "INCLUDE"。它匹配的文本就跟查找 "include" 时
一模一样。现在我们设定 'smartcase' 选项:

        :set ignorecase smartcase

如果你采用的模式里至少有一个大写字母，查找就成了大小写敏感的。可以这样理解，你
不必键入大写字母，也能查找到含有大写字母的词，所以，你若键入大写字母，必然是因
为你要大小写敏感的匹配。聪明!
    设定了这两个选项，你会找到以下匹配:

        模式                    匹配    
        word                    word，Word，WORD，WoRd，等。
        Word                    Word
        WORD                    WORD
        WoRd                    WoRd


单 个 模 式 里 的 大 小 写

如果你仅想忽略一个特定的模式里的大小写，那么，在模式前添加 "\c" 字符串就行了。
添加 "\C" 将使该模式的匹配大小写敏感。这排除了 'ignorecase' 和 'smartcase'
选项的影响，当 "\c" 或 "\C" 起作用时，它们设成什么值无关紧要。

        模式                    匹配    
        \Cword                  word
        \CWord                  Word
        \cword                  word，Word，WORD，WoRd，等。
        \cWord                  word，Word，WORD，WoRd，等。

采用 "\c" 和 "\C"
的好处在于它粘附在所用的模式上。因此，重复查找历史记录里的某个模式会产生同样
的结果。'ignorecase' 或 'smartcase' 是否更改部影响结果。

        备注:
        在查找模式中使用以 "\" 开头的项，其效果取决于 'magic' 选项。在本章中,
        我们将假定 'magic' 为真。这也是标准和建议的设定。如果你把它改了,
        那么，许多查找模式就会突然变得无效了。

        备注:
        如果你查了好久，超过了你预计的时间，你可以中断查找，在 Unix 上用
        CTRL-C，而在 MS-DOS 和微软视窗上则用 CTRL-Break。

*27.2*  在文件尾折返
在默认情况下，正向查找从当前光标位置开始，查找特定的字符串。然后它就遇到了文
件尾。如果那个时候还没找到那个字符串，它就从头来过，从文件开头一直查到光标处。
   记住，当你不断以 "n" 命令查找下一个匹配时，你最终回到第一个匹配。如果你不
注意，你将永远找下去! 为了提醒你，Vim 显示如下信息:

        search hit BOTTOM，continuing at TOP 

如果你使用 "?" 命令按相反方向查找，你得到的信息是这样的:

        search hit TOP，continuing at BOTTOM 

可是，你还是不知道你何时回到了第一个匹配。一种办法是设定 'ruler' 选项:

        :set ruler

Vim 将把光标位置显示在窗口的右下角 (如果使用了状态条的话，会显示在哪里)。看起
来像这样:

        101,29       84% 

第一个数字是光标所在的行号。在你开始查找的时候记住行号，那样你就能检查是否越
过了该位置。


无 折 返 查 找

要取消查找折返功能，请用以下命令:

        :set nowrapscan

现在当查找遇到文件末尾，一个出错信息就会显示出来:

        E385: search hit BOTTOM without match for: forever 

这样，你只要用 "gg" 命令回到文件开头，并一直查到你看到以上信息，你就能找到所
有的匹配。
   如果你用 "?" 从相反方向查找，你将得到:

        E384: search hit TOP without match for: forever

*27.3*  偏移
在默认情况下，查找命令让光标停留在匹配的模式的开始。你可以指定一个偏移，告诉
Vim 将光标停留在别的位置上。在正向查找命令 "/" 中指定偏移，就是在模式后面附加
一个斜线符 (/) 以及偏移值:

        /默认/2

这个命令查找模式 "默认"。找到后使光标越过匹配的模式而前移两行，并停留在该行的
行首。把这个命令用于以上段落中，Vim 在第一行找到词 "默认"。接着光标再往下移两行，
落在 "一个" 的 "一" 上。

如果该偏移为一简单数字，那么光标就会被放置在距离匹配那么多行的那一行的行首。
该偏移值可为正数或负数。如果它是正数，光标会向前移该数表示的行; 若为负数，则往
回退该数表示的行。


字 符 偏 移

偏移符 "e" 表示一个偏移从匹配末尾算起。它把光标移到匹配的最后一个字符上。命令:

        /const/e

把光标放到单词 "const" 的 "t" 上。
   加一个数字，光标就从该位置再前移该数字指定的那么多个字符。下面这个命令会将
光标移到匹配后面第一个字符:

        /const/e+1

一个正数使光标右移，负数使其左移。例如:

        /const/e-1

会把光标移到单词 "const" 的 "s" 字符上。

如果偏移以 "b" 开头，那么光标就移到匹配模式的首位。因为不用 "b" 光标也一样会被
移到首位，所以单独使用时没什么意义。在将它与一个加上或减去的数字合起来时，就很
有用了。光标就会前移或后移那么多个字符。例如:

        /const/b+2

会把光标移到匹配的首位，再往右移两个字符。因而落在字符 "n" 上。


重 复

当你重复前一次使用过的查找模式，只是偏移不同时，你可以把模式省略了:

        /that
        //e

等于:

        /that/e

再以同样的偏移重复查找:

        /

命令 "n" 具有同样的作用。要取消一个以前用过的偏移可以用:

        //


反 向 查 找

命令 "?" 以相同的方式使用偏移，但你必须以 "?" 来分隔模式和偏移，而非 "/":

        ?const?e-2

偏移符 "b" 和 "e" 的用途是一样的。它们并不因为使用了 "?" 而改变方向。


起 始 位 置

查找时，通常从光标位置开始。当你规定的是一个行偏移，这可能造成麻烦。例如:

        /const/-2

这个命令找到下一个单词 "const"，然后上移两行。如果你用命令 "n" 再找，Vim 就
从当前位置开始，找到同一个 "const" 匹配。然后再一次在偏移的作用下，回到开始
的地方。你给套住了!
   还有比这更糟糕的: 假定下一行另有一个 "const" 匹配。那么，重复正向查找就会
找到这个匹配，并上移两行。这样你实际上把光标往回移了!

当你规定的是一个字符偏移，Vim 将为其作调整。因此，查找会向前或向后跳过几个字
符再开始，以便同一个匹配不至于再出现。

*27.4*  匹配重复性模式
星号项 "*" 规定在它前面的项可以重复任意次。因此:

        /a*

匹配 "a"，"aa"，"aaa"，等等。但也匹配 "" (空字串)，因为零次也包含在内。
   星号 "*" 仅仅应用于那个紧邻在它前面的项。因此 "ab*" 匹配 "a"，"ab"，"abb",
"abbb"，等等。如要多次重复整个字符串，那么该字符串必须被组成一个项。组成一项的
方法就是在它前面加 "\("，后面加 "\)"。因此这个命令:

        /\(ab\)*

匹配: "ab"，"abab"，"ababab"，等等。而且也匹配 ""。

要避免匹配空字串，使用 "\+"。这表示前面一项可以被匹配一次或多次。

        /ab\+

匹配 "ab"，"abb"，"abbb"，等等。它不匹配 后面没有跟随 "b" 的 "a"。

要匹配一个可选项，用 "\="。 例如:

        /folders\=

匹配 "folder" 和 "folders"。


指 定 重 复 次 数

要匹配某一项的特定次数重复，使用 "\{n,m}" 这样的形式。其中 "n" 和 "m" 都是数字。
在它前面的那个项将被重复 "n" 到 "m" 次 (|inclusive| 包含 "n" 和 "m")。例如:

        /ab\{3,5}

匹配 "abbb"，"abbbb" 以及 "abbbbb"。
  当 "n" 省略时，被默认为零。当 "m" 省略时，被默认为无限大。当 ",m" 省略
时，就表示重复正好 "n" 次。例如:

        模式            匹配次数 
        \{,4}           0，1，2，3 或 4
        \{3,}           3，4，5，等等
        \{0,1}          0 或 1，同 \=
        \{0,}           0 或 更多，同 *
        \{1,}           1 或 更多，同 \+
        \{3}            3


匹配尽可能少的字符

迄今为止，我们所讨论过的都试图匹配尽可能多的字符。若要匹配尽可能少的字符，请
用 "\{-n,m}"。它的用法跟 "\{n,m}" 一样，唯一的区别在于，它采用尽可能少的字符。
   例如，以下命令:

        /ab\{-1,3}

将匹配 "abbb" 中的 "ab"。实际上，因为没理由匹配更多，所以它永远不会匹配超过
一个 b。它需要其它的来强制它超过其下限规定次数，而匹配更多的重复。
   这些同样的规则也适用于省略 "n" 和 "m" 的情形。甚至可以把两个都省略，只剩
"\{-}"。这个项匹配其前项的重复，重复次数尽可能少，可以等于或大于零。这个项如
单独使用，则总是匹配前项的零次重复。当它跟与其它的模式合起来时，用处就大了。
例如:

        /a.\{-}b

这个命令匹配 "axbxb" 中的 "axb"。如果采用了下面这个模式:

        /a.*b

由于 ".*" 匹配尽可能多的字符，整个 "axbxb" 都会被匹配。

*27.5*  多择一
在一个查找模式中，"或" 运算符是 "\|"。例如:

        /foo\|bar

这个命令匹配了 "foo" 或 "bar"。更多的抉择可以连在后面:

        /one\|two\|three

匹配 "one"，"two" 或 "three"。
   如要匹配其多次重复，那么整个抉择结构须置于 "\(" 和 "\)" 之间:

        /\(foo\|bar\)\+

这个命令匹配 "foo"，"foobar"，"foofoo"，"barfoobar"，等等。
   再举个例子:

        /end\(if\|while\|for\)

这个命令匹配 "endif"，"endwhile" 和 "endfor"。

一个与此相关的项是 "\&"。它要求两个抉择都与同一位置的文本相符。而最终匹配的则
是最后面的那个抉择。例如:

        /forever\&...

这个命令匹配 "forever" 中的 "for" (译者: 因为第二抉择要求三个字符)。它将不匹
配，比如说 "fortuin" (译者: 不符合第一抉择)。

*27.6*  字符域
你可以用 "/a\|b\|c" 来匹配 "a"，"b" 或 "c"。当你需要匹配自 "a" 至 "z" 所有的
字母时，以这样的方式表达就嫌长了。这里有个比较简短的表达方式:

        /[a-z]

方括号结构 [] 匹配单个字符。你在括号内指定哪些字符可以匹配。你可以把一系列字
符包含在内，像这样:

        /[0123456789abcdef]

这个命令将匹配其中的任何一个字符。你可以为一系列连续字符规定一个字符域。"0-3"
表示 "0123"。"w-z" 表示 "wxyz"。因此，上面那个命令可以缩短为:

        /[0-9a-f]

若要匹配字符 "-" 本身，就得把它放在字符域的第一或最后的位置上。Vim 会识别下面这
些特殊字符，以便在 [] 字符域里使用它们较为方便 (它们实际上可被用于任何查找模
式的任何地方):

        \e      <Esc>
        \t      <Tab>
        \r      <CR>
        \b      <BS>

还有若干特殊场合用得上 [] 字符域，参阅 |/[]| 以了解全部用法。


补 域

为了避免匹配到一个特定的字符，在字符域首位使用 "^"。这样方括号项 [] 就会匹配
任何括号内不包括的字符。例如:

        /"[^"]*"

         "        双引号
          [^"]    双引号以外的任何字符
              *   尽可能多个
               "  又一个双引号

这个命令匹配 "foo" 和 "3!x"，包含双引号在内。


预 定 义 的 域

有些字符域使用得很频繁。Vim 为这些字符域提供了一些捷径。例如:

        /\a

这个命令找寻字母字符。这相当于使用 "/[a-zA-Z]"。下面还有几个这样的字符域:

        项      匹配                    相当于 
        \d      数码                    [0-9]
        \D      非数码                  [^0-9]
        \x      十六进制数              [0-9a-fA-F]
        \X      非十六进制数            [^0-9a-fA-F]
        \s      空白字符                [       ]     (<Tab> 和 <Space>)
        \S      非空白字符              [^      ]     (非 <Tab> 和 <Space>)
        \l      小写字母                [a-z]
        \L      非小写字母              [^a-z]
        \u      大写字母                [A-Z]
        \U      非大写字母              [^A-Z]

        备注:
        使用这些预定义的字符域要比使用它们所表示的那个字符域快很多。
        这些项不能用于 [] 方括号内。因此 "[\d\l]" 不能用来匹配一个数字或一个
        小写字母。请换用 "\(\d\|\l\)"。

|/\s| 包括一个这类域的完整的列表。

*27.7*  字符类
一个特定的字符域匹配一组固定的字符。一个字符类与字符域相似，不过有个本质的区
别: 一个字符类代表的那组字符可以重新定义而无须改动查找模式。
   例如，查找这个模式:

        /\f\+

其中 "\f" 项表示文件名字符。因而这个命令匹配一个由可用作文件名的字符字符组成
的序列。
   哪些字符可以用来组成文件名取决于你所使用的系统。在微软视窗上，反斜线符可
以，而在 Unix 上却不行。文件名字符由 'isfname' 选项来规定。在 Unix
上，该选项的默认值为:

        :set isfname
        isfname=@,48-57,/,.,-,_,+,,,#,$,%,~,=

在其它系统上，其默认值各不相同。因此你可以用 "\f" 组成一个查找模式，以匹配一
个文件名。该查找模式将自动调整以适应你所使用的系统。

        备注:
        实际上，Unix 允许在文件名里使用几乎所有的字符，包括空格字符。把这些字
        符包括在 'isfname' 里，在理论上是没错的。但那样就无法在文本中发现一个
        文件名在哪儿结束。因此选项 'isfname' 的默认值是个折衷方案。

字符类有如下这些:

        项      匹配                            选项 
        \i      标识符字符                      'isident'
        \I      类似于 \i，但不包括数字
        \k      关键词字符                      'iskeyword'
        \K      类似于 \k，但不包括数字
        \p      可打印字符                      'isprint'
        \P      类似于 \p，但不包括数字
        \f      文件名字符                      'isfname'
        \F      类似于 \f，但不包括数字

*27.8*  匹配换行符
Vim 能找寻含有换行符的模式。你需要指定换行符在哪儿出现，因为迄今为止所有我们
曾经提到过的项，都不匹配换行符。
   用 "\n" 项可以在一个特定的位置查验一个换行符：

        /the\nword

这个命令将在一行以 "the" 结尾，而下一行以 "word" 开头的地方找到匹配。如果还
要匹配 "the word"，那么你需要匹配一个空格或一个换行符。这可以用 "\_s" 表示:

        /the\_sword

若要允许任意数量的空格:

        /the\_s\+word

这个命令也匹配 "the  " 在行尾，及 "   word" 在下一行行首的情形。

"\s" 匹配空格字符，"\_s" 匹配空格字符或一个换行符。同理，"\a" 匹配一个字母字
符，而 "\_a" 匹配一个字母字符或一个换行符。其它字符类和字符域都可以通过插入一
个 "_" 来更改其范围。

很多别的项也可以在前面加 "\_" 以匹配一个换行符。例如: "\_." 匹配任意字符或一
个换行符。

        备注:
        "\_.*" 匹配任何字符，直至文件结束。要小心，它会使查找命令执行得非常缓慢。

另一个例子是 "\_[]"，一个包含了换行符的字符域:

        /"\_[^"]*"

这个命令找寻位于一对双引号之间，可能分隔成数行的文本。

*27.9*  举例
这儿有几个查找模式，你也许会觉得有用。本节向你演示如何综合使用前面提及的那些
用法。


寻 找 一 个 加 州 驾 驶 牌 照

有一个驾驶牌照号码为 "1MGU103"。它有一个数字，三个大写字母，然后三位数字。直
接把这个号码放入查找模式:

        /\d\u\u\u\d\d\d

另一种方法是用一个计数器来指定其中有三个数字和三个字母:

        /\d\u\{3}\d\{3}

换用 [] 字符域方法:

        /[0-9][A-Z]\{3}[0-9]\{3}

这些方法之中你应该使用哪一种? 挑那种你记得住的。你记得住的简单方法要比你记不
住的华丽方法快得多。如果你能把它们都记住，那么避免使用最后那种，因为它要打的
字多，而且执行起来慢。


寻 找 一 个 标 识 符

在 C 程序里 (以及其它很多计算机程序) 一个标识符以字母开头，其余部分由字母和数
字组成。下划线字符也可以。这样一个标识符可以用下面的命令找到:

        /\<\h\w*\>

"\<" 和 "\>" 用来寻找那些完整的词。"\h" 表示 "[A-Za-z_]"，而 "\w" 则表示
 [0-9A-Za-z_]"。

        备注:
        "\<" 和 "\>" 取决于 'iskeyword' 选项。如果这个选项包括 "-" 的话，那么
         "ident-" 就不匹配了。在这种情况下，请用:

                /\w\@<!\h\w*\w\@!

        这个命令查验是否 "\w" 不匹配标识符之前或之后的字符。
        参见 |/\@<!| 和 |/\@!|。


下一章: |usr_28.txt|  折叠

版权: 参见 |manual-copyright|  vim:tw=78:ts=8:ft=help:norl:

Generated by vim2html on 2006年 07月 02日星期日 22:43:25 UTC

USR_27

27.1 忽略大小写

27.2 在文件尾折返

27.3 偏移

27.4 匹配重复性模式

27.5 多择一

27.6 字符域

27.7 字符类

27.8 匹配换行符

27.9 举例