В чем разница между регулярным выражением vim и нормальным регулярным выражением?

21

Я заметил, что переменное regex vim немного отличается от другого regexp. В чем разница между ними?

    
задан guilin 桂林 05.10.2010 в 16:12
источник
  • Определить «нормальное регулярное выражение». Каждый двигатель регулярных выражений, по крайней мере, тонко отличается от почти любого другого. –  sepp2k 05.10.2010 в 16:17

5 ответов

24

Если под «нормальным регулярным выражением» вы подразумеваете регулярные выражения, совместимые с Perl (PCRE), то помощь Vim дает хорошее резюме различий между регулярными выражениями Vim и Perl's:

:help perl-patterns

Вот что он говорит о Vim 7.2:

9. Compare with Perl patterns                           *perl-patterns*

Vim's regexes are most similar to Perl's, in terms of what you can do.  The
difference between them is mostly just notation;  here's a summary of where
they differ:

Capability                      in Vimspeak     in Perlspeak ~
----------------------------------------------------------------
force case insensitivity        \c              (?i)
force case sensitivity          \C              (?-i)
backref-less grouping           \%(atom\)       (?:atom)
conservative quantifiers        \{-n,m}         *?, +?, ??, {}?
0-width match                   atom\@=         (?=atom)
0-width non-match               atom\@!         (?!atom)
0-width preceding match         atom\@<=        (?<=atom)
0-width preceding non-match     atom\@<!        (?!atom)
match without retry             atom\@>         (?>atom)

Vim and Perl handle newline characters inside a string a bit differently:

In Perl, ^ and $ only match at the very beginning and end of the text,
by default, but you can set the 'm' flag, which lets them match at
embedded newlines as well.  You can also set the 's' flag, which causes
a . to match newlines as well.  (Both these flags can be changed inside
a pattern using the same syntax used for the i flag above, BTW.)

On the other hand, Vim's ^ and $ always match at embedded newlines, and
you get two separate atoms, \%^ and \%$, which only match at the very
start and end of the text, respectively.  Vim solves the second problem
by giving you the \_ "modifier":  put it in front of a . or a character
class, and they will match newlines as well.

Finally, these constructs are unique to Perl:
- execution of arbitrary code in the regex:  (?{perl code})
- conditional expressions:  (?(condition)true-expr|false-expr)

...and these are unique to Vim:
- changing the magic-ness of a pattern:  \v \V \m \M
   (very useful for avoiding backslashitis)
- sequence of optionally matching atoms:  \%[atoms]
- \& (which is to \| what "and" is to "or";  it forces several branches
   to match at one spot)
- matching lines/columns by number:  \%5l \%5c \%5v
- setting the start and end of the match:  \zs \ze
    
ответ дан Bill Odom 05.10.2010 в 22:01
источник
15

«Регулярное выражение» действительно определяет алгоритмы, а не синтаксис. Это означает, что различные ароматы регулярных выражений будут использовать разные символы для обозначения того же самого; или они будут префикс некоторых специальных символов с обратными косыми чертами, где другие нет. Они обычно будут работать одинаково.

Когда-то, POSIX определил синтаксис Basic Regular Expression (BRE), который в основном следует Vim. Вскоре также было выпущено предложение синтаксиса расширенного регулярного выражения (ERE). Основное различие между ними состоит в том, что BRE имеет тенденцию рассматривать больше символов как литералов - «a» - это «a», но также и «(« есть »(«, а не особый характер », и поэтому включает в себя больше обратных косых черт придайте им «особое» значение.

Обсуждение сложных различий между Vim и Perl на отдельном комментарии здесь полезно, но также стоит упомянуть несколько более простых способов, в которых вариации Vim отличаются от «принятой» нормы (по которой вы, вероятно, имеете в виду Perl. ) Как упоминалось выше, они в основном отличаются использованием предшествующей обратной косой черты.

Вот несколько очевидных примеров:

Perl    Vim     Explanation
---------------------------
x?      x\=     Match 0 or 1 of x
x+      x\+     Match 1 or more of x
(xyz)   \(xyz\) Use brackets to group matches
x{n,m}  x\{n,m} Match n to m of x
x*?     x\{-}   Match 0 or 1 of x, non-greedy
x+?     x\{-1,} Match 1 or more of x, non-greedy
\b      \< \>   Word boundaries
$n      \n      Backreferences for previously grouped matches

Это дает вам аромат самых важных различий. Но если вы делаете что-то более сложное, чем основы, я предлагаю вам всегда предполагать, что Vim-regex будет отличаться от Perl-regex или Javascript-regex и проконсультироваться с чем-то вроде Веб-сайт Vim Regex .

    
ответ дан J-P 13.02.2013 в 11:38
источник
  • Удивительно, спасибо. Это меня каждый раз вызывает! –  Paul Ruane 27.11.2013 в 13:19
  • это был лучший ответ и помог мне разобраться в том, что я искал благодаря. –  jimh 30.03.2017 в 01:46
3

Слишком широкий вопрос. Запустите vim и введите :help pattern .

    
ответ дан Benoit 05.10.2010 в 16:15
источник
2

Попробуйте очень волшебный режим регулярного выражения Vim. Он больше похож на традиционное регулярное выражение, просто добавьте свой шаблон с \v . Дополнительную информацию см. В разделе :help /\v . Мне это нравится.

    
ответ дан butterywombat 28.10.2014 в 05:43
источник
  • традиционным регулярным выражением, вы имеете в виду базовые регулярные выражения (BRE) или PCRE? –  alpha_989 13.09.2017 в 02:39
  • pcre :) больше текстового текста –  butterywombat 12.10.2017 в 23:33
1

Существует плагин под названием eregex.vim , который переводится с PCRE (совместимый с Perl обычный выражения) к синтаксису Вима. Для достижения этого перевода требуется более тысячи строк vim! . Думаю, это также служит точной документацией о различиях.

    
ответ дан Evgeni Sergeev 11.01.2014 в 21:10
источник