Tag: regex

Pymongo Regex $ все несколько поисковых запросов

Я хочу искать MongoDB, чтобы получить только результаты, где все x находятся в некоторой конфигурации вместе с ключом. collected_x = '' for x in input: collected_x = collected_x + 're.compile("' + x + '"), ' collected_x_cut = collected_x[:-2] cursor = db.collection.find({"key": {"$all": [collected_x_cut]}}) Это не приносит ожидаемого результата. Если я сам вводю несколько x, он […]

TypeError: элемент последовательности 1: ожидается байтоподобный объект, str найден

Я пытаюсь извлечь английские названия из дампа тиков wiki, который находится в текстовом файле с использованием регулярного выражения в Python 3. Дамп wiki содержит названия на других языках и некоторые символы. Ниже мой код: with open('/Users/some/directory/title.txt', 'rb')as f: text=f.read() letters_only = re.sub(b"[^a-zA-Z]", " ", text) words = letters_only.lower().split() print(words) Но я получаю сообщение об ошибке: […]

Регулярное выражение python заменяет две ситуации одной командой

Я хочу заменить строку как '''1 2 3 4 5 6 abcde fghij klmno pqrst 7 8 9 10 uvwxyz abcdef 11 12 13''' в '''1 2 3 4 5 6 abcde fghij klmno pqrst 7 8 9 10 uvwxyz abcdef 11 12 13''' это мой метод: s = re.sub(r'(\d) ([az])', r'\1\n\2', s) s = […]

Найти / заменить URL-адрес в документе с помощью регулярного выражения Python

Эксперты регулярных выражений Python! Я пытаюсь изменить строку в XML-документе. Исходная строка: <Tag name="low" Value="%hello%\dir"/> Результат, который я хочу увидеть, это: <Tag name="low" Value="C:\art"/> Моя неудачная попытка: lines = re.sub("%hello%\dir"", "C:\art"/> Это не работает. Ничего не меняет в документе. Что-то с%? В целях тестирования я попробовал: lines = re.sub("dir", "C:\art", a) И я получаю: <Tag […]

Проблема с регулярным выражением внешнего вида Python: недопустимое регулярное выражение: look-behind требует шаблона с фиксированной шириной

Мне нужно сопоставить строки между двойными кавычками, как в: <p class="calibre1">“This is the first sentence.</p> <p class="calibre1">And this is the second!”</p> Это будет соответствовать </p> <p class="calibre1"> Теперь я получил эту работу с регулярным выражением (?<=“[^”]*)</p>\s*<p[^>]*>(?!“) но я получаю ошибку, описанную в названии: « Недопустимое регулярное выражение: look-behind требует шаблон фиксированной ширины », когда я […]

Python не-жадное регулярное выражение для очистки xml

У меня есть файл «xml file», в котором есть некоторые нежелательные символы <data> <tag>blar </tag><tagTwo> bo </tagTwo> some extra characters not enclosed that I want to remove <anothertag>bbb</anothertag> </data> Я думал, что следующая не-жадная подстановка удалит символы, которые не были должным образом помещены в <sometag></sometag> re.sub("</([a-zA-Z]+)>.*?<","</\\1><",text) ^ ^ ^ ^ text is the xml txt. […]

Поиск уличного адреса в строке – Python или Ruby

Эй, мне было интересно, как найти уличный адрес в строке в Python / Ruby? Возможно, с помощью регулярного выражения? Кроме того, он будет в следующем формате (США) 420 Fanboy Lane, Купертино CA Благодаря!

Согласование нескольких групп регулярных выражений и их удаление

Мне был предоставлен файл, из которого я хотел бы извлечь полезные данные. Формат файла выглядит примерно так: LINE: 1 TOKENKIND: somedata TOKENKIND: somedata LINE: 2 TOKENKIND: somedata LINE: 3 и т.д… То, что я хотел бы сделать, это удалить LINE: и номер строки, а также TOKENKIND: поэтому я просто оставлен со строкой, состоящей из «somedata […]

Выполните проверку WebDriverWait () или аналогичную проверку регулярного выражения в Python

Я хотел бы иметь возможность выполнять что-то похожее на WebDriverWait() , то есть: WebDriverWait(driver, 60).until( expected_conditions.text_to_be_present_in_element((By.XPATH, "//tr[5]/td[11]/div"), "1.000000") ) … для регулярного выражения, где он ожидает отведенное количество времени перед сбоем. Я знаю, что могу что-то сделать, например … assert re.search(r"[0,1]{1}.[0-9]{6}", driver.find_element_by_xpath("//tr[5]/td[11]/div").text) … или я мог бы заменить поиск совпадением в приведенном выше примере. Проблема […]

регулярное выражение python более одного раза соответствует индексу строки поиска

Я ищу способ сделать функцию finditer модуля python re или более новым модулем регулярного выражения для соответствия всем возможным вариантам определенного шаблона, перекрытию или другим. Я знаю использование lookaheads для получения совпадений без использования строки поиска, но я все еще получаю только одно регулярное выражение для каждого индекса, где я мог бы получить больше одного. […]

Python - лучший язык программирования в мире.