Tag: regex

Python Regex для синтаксического анализа и возврата кортежа

Мне дали несколько строк для работы. Каждый из них представляет собой набор данных и состоит из имени набора данных и соответствующих статистических данных. Все они имеют следующую форму: s= "| 'TOMATOES_PICKED' | 914 | 1397 |" Я пытаюсь реализовать функцию, которая будет анализировать строку и возвращать имя набора данных, первое число и второе число. Есть […]

Онлайн-поиск работы утомительный. Помогите мне автоматизировать его

Многие рабочие места нарушили поисковые запросы, которые не позволяют сузить рабочие места по уровню опыта. Даже когда они это делают, это обычно неправильно. Это требует, чтобы вы пробирались через сотни сообщений, на которые вы не можете подать заявку, прежде чем найти подходящую, довольно утомительную. Поскольку я предпочитаю писать сопроводительные письма и т. Д., Я хочу […]

Как исправить регулярное выражение, которое пытается поймать какое-то слово и идентификатор?

У меня есть .txt файл, который выглядит как строка s . Строка s соответствует word_1 за которым следует word_2 id и number : word_1 word_2 id number Я хотел бы создать регулярное выражение, которое улавливает в списке все осколки слова "nunca" за которым следует id VM_ _ _ _ . Выпуск шаблона "nunca" и « […]

Как сопоставить ударные символы с регулярным выражением в Python?

Мне нужны решения для этого вопроса , кроме Python! Я попытался установить библиотеку регулярных выражений для Python, по-видимому, что позволяет использовать выражения POSIX в регулярных выражениях Python, но, тем не менее, я предполагаю, что он не включает символы Unicode в классе [:alpha:] . Например: >>> re.search(r'[[:alpha:] ]+','Please work blåbær and NOW stop 123').group(0) 'Please work […]

Как сгенерировать несколько деревьев синтаксического анализа для двусмысленного предложения в NLTK?

У меня есть следующий код в Python. sent = [("very","ADJ"),("colourful","ADJ"),("ice","NN"),("cream","NN"),("van","NN")] patterns= r""" NP:{<ADJ>*<NN>+} """ NPChunker=nltk.RegexpParser(patterns) # create chunk parser for s in NPChunker.nbest_parse(sent): print s.draw() Выход: (S (NP very/ADJ colourful/ADJ ice/NN cream/NN van/NN)) Но на выходе должно быть еще 2 дерева синтаксического анализа. (S (NP very/ADJ colourful/ADJ ice/NN) (NP cream/NN) (NP van/NN)) (S (NP very/ADJ […]

Как удалить пару ключ / значение из дампа yaml в Python?

Предположим, у меня есть наивное определение класса: import yaml class A: def __init__(self): self.abc = 1 self.hidden = 100 self.xyz = 2 def __repr__(self): return yaml.dump(self) A() печать !!python/object:__main__.A abc: 1 hidden: 100 xyz: 2 Есть ли чистый способ удалить строку, содержащую hidden: 100 из выходного документа yaml dump? Указанное имя ключа известно заранее, но […]

Как заполнить строку регулярных выражений параметрами

Я хотел бы заполнить переменные регулярного выражения строкой. import re hReg = re.compile("/robert/(?P<action>([a-zA-Z0-9]*))/$") hMatch = hReg.match("/robert/delete/") args = hMatch.groupdict() переменная args теперь является dict с {"action": "delete"}. Как я могу отменить этот процесс? С аргументом dict и regex pattern, как я могу получить строку «/ robert / delete /»? возможно ли иметь такую ​​функцию? def […]

RegEx Tokenizer: разделить текст на слова, цифры, знаки препинания и интервалы (ничего не удалять)

Я почти нашел ответ на этот вопрос в этой теме (ответ samplebias); однако мне нужно разделить фразу на слова, цифры, знаки препинания и пробелы / вкладки. Я также нуждаюсь в этом, чтобы сохранить порядок, в котором происходит каждая из этих вещей (что уже делает код в этом потоке). Итак, я нашел что-то вроде этого: from […]

Как изменить текст, который соответствует определенному регулярному выражению в Python?

Мне нужно отметить отрицательные контексты в предложении. Алгоритм выглядит следующим образом: Обнаружить отрицателя (нет / никогда / нет / нет / и т.д.) Обнаруживать пункт, заканчивающийся пунктуацией (.;:!?) Добавьте _NEG ко всем словам между ними. Теперь я определил регулярное выражение, чтобы выделить все такие случаи: def replacenegation(text): match=re.search(r"((\b(never|no|nothing|nowhere|noone|none|not|havent|hasnt|hadnt|cant|couldnt|shouldnt|wont|wouldnt|dont|doesnt|didnt|isnt|arent|aint)\b)|\b\w+n't\b)((?![.:;!?]).)*[.:;!?\b]", text) if match: s=match.group() print s news="" […]

Найти по тексту и заменить в HTML BeautifulSoup

Я пытаюсь выделить HTML-файл (буквально обертывая строки в тегах «mark»), используя python и BeautifulSoup. Проблема в основном заключается в следующем … Скажем, у меня есть свой оригинальный html-документ: test = "<h1>oh hey</h1><div>here is some <b>SILLY</b> text</div>" Я хочу сделать нечувствительный к регистру поиск строки в этом документе (игнорируя HTML) и обернуть ее в теги «mark». […]

Python - лучший язык программирования в мире.