Tag: regex

Замена названных групп захвата на re.sub

Я хочу заменить текст совпадающих шаблонов re в строке и сделать это с помощью re.sub() если передать его функцию как аргумент repl в вызове, он работает по желанию, как показано ниже: from __future__ import print_function import re pattern = r'(?P<text>.*?)(?:<(?P<tag>\w+)>(?P<content>.*)</(?P=tag)>|$)' my_str = "Here's some <first>sample stuff</first> in the " \ "<second>middle</second> of some other text." […]

Regex на Python печатает Мусор, когда используется класс char

Python 2.7 Я обрабатываю utf-8 закодированный файл (греческий) и кажется, что в regex есть некоторые проблемы. Regex работает нормально, когда я не использую класс char. Когда я делаю : text = re.sub('αυ','kk',text,flags=re.UNICODE) все работает отлично, и, например, «αυτιά» будет преобразовано в «kkτιά». Однако, когда я хочу использовать char-класс, например: text = re.sub('αυ[τ]','kk',text,flags=re.UNICODE) показан символ мусора, […]

Использование регулярных выражений для сопоставления слова в Python

Я использую PRAW, чтобы сделать reddit-бот, который берет автора комментариев того, кто говорит «alot», и сохраняет свое имя пользователя в списке. У меня возникают проблемы с регулярным выражением и как заставить строку работать. Вот мой код. #importing praw for reddit api and time to make intervals import praw import time import re username = "LewisTheRobot" […]

Regex соответствует многострочному тексту между двумя словами, включая слова

Я редактирую словарь и пытаюсь разместить каждый тэг произношения [s]…[/s] после тега транскрипции [c darkslategray]…[/c] . Проблема в том, что не все слова содержат как произношение, так и транскрипцию. Вот мое текущее регулярное выражение и часть словаря: (\s\[s\].*?\[\/s\]) (?s)(\s.*?\[c darkslategray\].*?\[\/c\]) Затем замените его $2$1 чтобы переместить теги. contrast [s]contra62.wav[/s] [b]con·trast[/b] [c blue][b]I[/b][/c] [m1]({{<vr>}}[p]or[/p] [b]A[/b]{{</vr>}})[c darkslategray]/kənˈtræst, […]

Нечувствительность к Python Замените все несколько строк

Я хочу заменить все вхождения набора строк в текстовую строку. Я придумал такой подход, но я уверен, что есть лучший способ сделать это: myDict = {} test = re.compile(re.escape('pig'), re.IGNORECASE) myDict['car'] = test test = re.compile(re.escape('horse'), re.IGNORECASE) myDict['airplane'] = test test = re.compile(re.escape('cow'), re.IGNORECASE) myDict['bus'] = test mystring = 'I have this Pig and that […]

Вариант соответствия регулярному выражению python

Я хотел бы использовать вариант соответствия. У меня есть фрагмент кода для поиска строки в списке. Я думаю, что есть более элегантный способ сделать то же самое. searchString = "maki" itemList = ["Maki", "moki", "maki", "Muki", "Moki"] resultList = [] matchCase = 0 for item in itemList: if matchCase: if re.findall(searchString, item): resultList.append(item) else: if […]

Regex должен обрабатывать пробелы, в том числе newline, по-разному

Моя цель – создать регулярное выражение, которое может обрабатывать 2 ситуации: Несколько пробелов, включая одну или несколько строк новой строки в любом порядке, должны стать одной новой строкой Множество пробелов, исключая любую новую строку, должно стать пространством Неудобство в сочетании с различными случаями для новой строки и без новой строки делает этот комплекс сложным. Каков […]

Форматирование строк / Шаблон / Регулярные выражения

У меня есть строковый формат, скажем, где A = буквенно-цифровое и N = целое, поэтому шаблон «AAAAAA-NNNN» теперь пользователь иногда пропускает тире, а иногда «NNNN» – это всего три цифры, в этом случае мне это нужно pad a 0. Первая цифра «NNNN» должна быть 0, поэтому, если она является номером, это последняя цифра «AAAAAA», а […]

Получение всех вопросов о функциях переполнения стека

Я пытаюсь написать программу для извлечения всех ссылок для вопросов, имеющих активные награды в определенном теге. Я еще не реализовал конкретную функцию тега, потому что я застрял, просто попытаюсь получить все ссылки. from re import findall from urllib.request import urlopen def fetch_source(url): return str(urlopen(url).read()) site = 'http://stackoverflow.com/?tab=featured' def fetch_links(source): source = fetch_source(source) return findall("\/questions\/[0-9]*\/(?:[Az]|\-)+", source) […]

Удаление строк из списка, содержащего даты, без учета отдельных дат в списке

Прежде всего, извините за длинный титул. Вот мои системные спецификации. Windows 7 64 бит, запуск python 3.4.3 64 бит в Pycharm Educational Edition 1.0.1 Теперь о проблеме. У меня есть список, содержащий данные, вытащенные с веб-сайта. Список содержит строки, некоторые – просто даты, некоторые – просто слова, а некоторые – даты со словами. Это выглядит […]

Python - лучший язык программирования в мире.