У меня doc-файлы с форматированием пробелами.
У меня doc-файлы с форматированием пробелами.
{"ts":9999999999.03091,"payload":"<iq xmlns='jabber:client' type='result' id='purple2d31ca58' to='042@xxxxxxxx.xxxxx.xxxxx.ru/perl'/>","type":"receive"}
С помощью Perl'а:
cat log | perl -nE'/"ts":\K\d+(?{ say "$.). $_" if 8888888888 < $& })/'
Учите регулярные выражения. В жизни пригодятся.
perlmonks.org
Где-то между 0 и 1
Ничего страшного, просто удивил не младший Perl-разработчик плохо знающий регвыры. Теперь я видел всё.
Прособеседовали разработчика некоторое время назад. Хороший дядька, аккуратно пишет, ответил на разные вопросы по синтаксису и тестовое задание сделал неплохо. Специально по регулярным выражениям гонять не стали. Что-то спросили конечно, но не углублялись. Оказалось зря. Оч слабо регвыры знает. По классификации : Где-то между 0 и 1
Ничего страшного, просто удивил не младший Perl-разработчик плохо знающий регвыры. Теперь я видел всё.
regex101.com
/^(?!.(^|\/|\\)(foo|bar)($|\/|\\))./g
— матчит пути, НЕ содержащие папку или файл с именем foo или bar.
/^(?!.(^|\/|\\)(foo|bar)($|\/|\\))./g
— матчит пути, НЕ содержащие папку или файл с именем foo или bar.
— посмотрите внимательно:
1)
"^$|^[[:space:]]*#"
2)
'^[[:space:]]$|^ #'
— есть ли разница?
А почему этот DFA сразу в glibc не засунуть, если он быстрый?
Народ! Вот имею вновь вопрос: нужно из строки вида: <someword><100> Дёрнуть нечто первое меж ковычек. И оно, по идее выглядит как ^<*> или ^<\\w*>, или даже <*>, но отчего - то pattent.matcher(testWord) возвращает пустоту, вроде той, которая была бы в "", несмотря на то, что входная строка похожа на приведённую. Может отличаться только наличием пробелов, цифр, и знака минуса. Как быть? Что нужно, чтобы строкой вида strAT = ma.group(0); где Matcher ma = pattern.matcher(strA); получить нужное?
return str.split("(?<=\\d)/(?=\\D)|(?<=\\D)/(?=\\d)|(?<=\\d)(?=\\D)|(?<=\\D)(?=\\d)");
$ echo 'глядите на него' | sed -n '/\<гляд/p'
глядите на него
$ echo 'hello world' | grep '\<world'
hello world
gskinner.com Удобный тестер регулярок с информативными всплывающими хинтами.
$ cat > regex.php
<?php
$pattern = "<hello>";
$string = "<hello>, world!";
$string = preg_replace ($pattern, "", $string);
echo $string;
?>
$ php regex.php
<>, world
Почему-то угловые скобочки не удаляются, что дѣлать?
$ expr a : 'a\( b\)*'
man 1p expr:
Alternatively, if the pattern contains at least one regular expression subexpression "[\(...\)]", the string corresponding to "\1" shall be returned.
По кодам возврата:
0 The expression evaluates to neither null nor zero.
1 The expression evaluates to null or zero.
Так что в GNU всё по POSIX, а OpenBSD — увы.
почему не матчится? почему не сделать нормальные регвыры?
— Нет.
— Почему?
— /A(?=[-_a-zA-Z0-9]?[A-Z])(?=[-_a-zA-Z0-9]?[a-z])(?=[-_a-zA-Z0-9]*?[0-9])[-_a-zA-Z0-9]{6,}z/
— Понятно.
типичный высер программиста на C++: boost::regex exp("<td class=\"f\">[^>]*?>([^<]*?)<\/a>.*?\n.*?\n.*?\n.*?\n[^<]*?<a href=\"([^<]*?)\">(.*?)<\/a>.*?\n.*?\n[^<]*?<td class=\"dl\">\n.*?\n[^<]*?<b class=\"sd\">([^<]*?)<\/b>[^<]*?<b class=\"lc\">([^<]*?)<\/b>\n.*?\n.*?\n[^>]*?>([^<]*?)<\/a>"); http://www.linux.org.ru/forum/development/7605631?
Примерно так должен был выглядеть предыдущий пост. Пора отдыхать, определенно.
that of other tools в новой версии, то это относится к восьмибитным кодировкам.
Раньше dfa вызывал функцию strcoll, и происходило смешение больших и маленьких букв. Если же использование dfa было невозможным (ссылки назад в регвыре), то работало по-другому. Теперь эта путаница устранена.
# grep '[а-я]' myfile | grep -v '[0-9]' | wc -l
623
# sed '/[а-я]/!d;/[0-9]d;' | wc -l
619
`loadP( {нужная фигня}`
регекс `loadP\((.*?)}` выдает то что нужно но без } скобочки. А можно как-то красиво сделать что бы скобочка была?
#962287
Back-references не поддерживаются только при работѣ съ Extended POSIX regexes, съ BASIC — все работаетъ. Маны нужно читать внимательнѣе, тамъ написано не только про ‘dreadful botch’ , но и сказано, гдѣ этотъ ‘botch’ работаетъ, а гдѣ — нѣтъ.
Продолжая Back-references не поддерживаются только при работѣ съ Extended POSIX regexes, съ BASIC — все работаетъ. Маны нужно читать внимательнѣе, тамъ написано не только про ‘dreadful botch’ , но и сказано, гдѣ этотъ ‘botch’ работаетъ, а гдѣ — нѣтъ.