Tag: regex

Почему моя команда re.search не работает?

У меня есть это условие «если» внутри моего скрипта: if ( re.search(argVariable, newArgs) ): Однако он терпит неудачу, когда я передал определенное значение для параметра argVariable, Пример вывода: Searching for the argument: -XX:+HeapDumpOnOutOfMemoryError argVariable: "-XX:+HeapDumpOnOutOfMemoryError" "-XX:+HeapDumpOnOutOfMemoryError" is MISSING, Adding… Я уверен, что моя переменная newArgs уже имеет это. (Смотри ниже) New args: -Xverbosetimestamp -Xverbose:memory -XX:+CrashOnOutOfMemoryError […]

Функциональная маскировка массива numpy string в Python

Я пытаюсь извлечь либо первую (или только) плавающую точку, либо целое число из таких строк: str1 = np.asarray('92834.1alksjdhaklsjh') str2 = np.asarray'-987___-') str3 = np.asarray'-234234.alskjhdasd') где, если правильно разобрать, мы должны получить var1 = 92834.1 #float var2 = -987 #int var3 = -234234.0 #float Используя свойство «маскирования» массивов numpy, я придумываю что-то вроде любой из переменных […]

Regex, который даст определенные слова python

Я ищу регулярное выражение, которое дает слова, начинающиеся с букв, цифр или подчеркивания ('_'). Он может включать только точку ('.') Между словами, а не в конце, и должен удалять все другие специальные символы. например WARC-_Target-URI: http://www.allchocolate.com/health/basics/ должен дать WARC, _Target, URI, http, www.allchocolate.com, здоровье, основы Любая помощь будет оценена.

Код для удаления текста из результатов Scrapy

Ниже приведен образец кода HTML, который я хочу очистить с помощью scrapy. <body> <h2 class="post-title entry-title">Sample Header</h2> <div class="entry clearfix"> <div class="sample1"> <p>Hello</p> </div> <!–start comment–> <div class="sample2"> <p>World</p> </div> <!–end comment–> </div> <ul class="post-categories"> <li><a href="123.html">Category1</a></li> <li><a href="456.html">Category2</a></li> <li><a href="789.html">Category3</a></li> </ul> </body> Сейчас я использую следующий рабочий код: from scrapy.contrib.spiders import CrawlSpider, Rule from […]

Emoji не обнаружен с регулярным выражением python в Linux

У меня есть регулярное выражение для обнаружения emojis: emoji = u'(\ud83c[\udf00-\udfff]|\ud83d[\udc00-\ude4f\ude80-\udeff]|[\u2600-\u26FF\u2700-\u27BF])' и я тестирую с помощью этой команды: re.match(emoji, u'\U0001f602', re.UNICODE) # "😂" Проблема в том, что если находит совпадение на моей машине macOs, но не на Linux Debian Использование ipython 4.0.1 и Python 2.7.11 Как из дистрибутива conda. Почему проблема связана с Linux?

Python Regex для альфа (alpha | digit) *

Я пытаюсь создать регулярное выражение python для представления идентификаторов для лексического анализатора. Мой подход: ([a-zA-Z]([a-zA-Z]|\d)*) Когда я использую это в: regex = re.compile("\s*([a-zA-Z]([a-zA-Z]|\d)*)") regex.findall(line) Он не создает список идентификаторов, как должен. Я неправильно сформулировал это выражение? Каким образом можно представить форму: alpha(alpha|digit)* С модулем python re?

regex не будет соответствовать ожидаемому использованию beautifulsoup

Я пытаюсь использовать регулярное выражение для соответствия тэгам с классом = "calendar-days-list2", но не class = "calendar-days-list2 prev-next-month". Я загрузил образец фрагмента HTML с тегами, содержащими обе опции. Когда я просматриваю образец HTML, используя re.findall (), регулярное выражение совпадает, как мне хотелось бы. Когда я использую это регулярное выражение образца в beautifulsoup, он возвращает как […]

Python: анализ только текста из HTML с помощью bs4 и RegEx

Я создаю сканер python3 / скребок с помощью bs4. Есть некоторые части, которые нуждаются в Reg Ex. Я хочу только очистить текстовое содержимое. Как мне разобрать что-то вроде этого: <p> This is blah blah <a class="wordpresslink" href="https://wordpress.com/" rel="generator nofollow">WordPress.com</a> <a href="http://www.whatever.com/"><span class="s1">Example</span></a> Like blah blah </p> Я хочу вывод: This is blah blah WordPress.com Example […]

Преобразование Python re.sub в C #

Я пытаюсь сделать преобразование из Python в C # sconvert = re.sub(r"([.$+?{}()\[\]\\])", r"\\\1", sconvert) Я не смог найти эквивалент C # .Net для этой функции, чтобы упростить задачу. Из руководства Python re.sub (pattern, repl, string, count = 0, flags = 0) Возвращает строку, полученную путем замены самых левых неперекрывающихся вхождений шаблона в строку заменяющим repl. […]

Как удалить блоки комментариев только для ASP в Python (на Sublime Text 2)?

Я играю с Python Regex, чтобы очистить код, созданный для страниц классического ASP. Мне нужно удалить блоки комментариев SINGLE LINE или MULTILINE ASP. (строки комментариев ASP обычно начинаются с цитаты ). Я хочу сопоставить блоки, не содержащие исполняемого кода, а только блоки, содержащие комментарии. Wether в комментариях есть пробелы или пробелы, мне нужно заменить эти […]

Interesting Posts for Van-Lav

Проверьте равенство нескольких аргументов с помощью Numpy

Является ли timsort универсальным или специфичным для Python?

Selenium WebDriver не может загружать профиль

Как реализовать групповые шаблоны, классы символов, классы символов с отрицанием и т. Д. В модели для регулярной грамматики?

Как распечатать результаты сопоставления регулярных выражений в python 3?

argpartsort / partort 2D-массива, поддерживающий исходные размеры массива

Указание формата даты при конвертации с помощью pandas.to_datetime

Код Python, чтобы вызвать обратное нажатие клавиши?

Beautiflsoup Создать суп с фрагментом источника страницы

Путь шаблона Django

Как бороться с Cython ValueError

Как превратить строку Flask Markup в обычную строку

Python – короткий способ распаковать список для оператора форматирования строк?

Как предотвратить завершение запущенной программы с помощью «ctrl + c» в Linux с помощью python?

Поскольку Selenium IDE не поддерживается, как быстро писать тесты Selenium?

Python - лучший язык программирования в мире.