Tag: regex

IP-адрес regex python

У меня проблема с регулярным выражением, мне нужно самое эффективное регулярное выражение, которое соответствует IP-адресу и только в диапазоне 255. Я пробовал этот « ip_pattern = '\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}' ", но он соответствует даже номера более 255, например 321.222.11.4

Удаление периодов в конце предложений в python

У меня есть такие предложения: «Это тест 4.55 и 5000». Я хочу удалить период в конце предложений, но не между числами. Мой результат должен быть – «это тест 4.55 и 5000». Я попробовал следующие параметры, но не получил требуемый вывод: wordList = "this is a test. 4.55 and 5,000." pattern3 = re.compile("[^\w\d]+") wordList = pattern3.sub(' […]

Scrapy – Как извлечь все сообщения в блоге из категории?

Я использую scrapy для извлечения всех сообщений в моем блоге. Проблема в том, что я не могу понять, как создать правило, которое читает все сообщения в любой заданной категории блога? Например: В моем блоге категория «Настройка среды» содержит 17 сообщений. Таким образом, в коде scrapy я могу записать его как указано, но это не очень […]

Регулярное выражение Python: почему это не работает?

Это не дает мне ошибки и ответа. re.sub('\\.(\\W|\\.)*[o0](\\W|[o0])*', '*', '……………………………………') Почему он ведет себя так? Кроме того, если я уменьшу количество «периодов», то он будет работать. Спасибо.

Разбор PDF-файла с использованием регулярных выражений в Python

Я пытаюсь проанализировать некоторые элементы объекта из файла PDF, используя re-модуль Python. Моя цель – проанализировать каждый объект PDF с использованием регулярного выражения. Пример объекта PDF: 1 0 obj << /Type /Catalog /Pages 2 0 R >> endobj 2 0 obj << /Type /Pages /Kids [ 3 0 R ] /Count 1 >> endobj … […]

Как преобразовать некоторый символ в пятизначный unicode в Python 3.3?

Я хотел бы преобразовать некоторый символ в пятизначный unicode в Python 3.3. Например, import re print(re.sub('a', u'\u1D15D', 'abc' )) но результат отличается от того, что я ожидал. Должен ли я сам поставить персонаж, а не код? Есть ли лучший способ обработки пятизначных символов Юникода?

Regex для выделения вложенных шаблонов

Возможный дубликат: Согласование вложенных структур с регулярными выражениями в Python Я не могу обойти эту проблему. У меня есть строка, подобная следующей: Lorem ipsum dolor sit amet [@a xxx yyy [@b xxx yyy [@c xxx yyy]]] lorem ipsum sit amet Моя задача состояла бы в извлечении команд (они всегда начинаются с [@ и заканчиваются на […]

изменение оператора ** на силовую функцию с помощью синтаксического анализа?

Мое требование состоит в том, чтобы изменить ** оператор на функцию питания Например 1.Input -"B**2" Output – power(B,2) 2."B**2&&T**2*X" Output – power(B,2) Я написал следующее регулярное выражение для решения этой проблемы rx=r"([a-zA-Z0-9]+)\*\*([a-zA-Z0-9()]+)" result = regex.sub(rx, r"power(\1,\2)", expression, 0, regex.IGNORECASE | regex.MULTILINE) Но выше код успешно конвертирует выражение, аналогичное примеру 1 и примеру 2, но не […]

Pandas Python Regex: ошибка: ничего не повторять

У меня есть dataframe с несколькими странными символами, «*» и «-». import pandas as pd import numpy as np data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions', 'Lions', 'Lions'], 'wins': [11, '*', 10, '-', 11, 6, 10, 4], 'losses': [5, 8, 6, 1, 5, 10, […]

Pandas Чтение CSV с разделителями строк с помощью регулярных выражений

Я пытаюсь импортировать странно форматированный текстовый файл в pandas DataFrame. Ниже приведены две строки: LOADED LANE 1 MAT. TYPE= 2 LEFFECT= 1 SPAN= 200. SPACE= 10. BETA= 3.474 LOADEFFECT 5075. LMAX= 3643. COV= .13 LOADED LANE 1 MAT. TYPE= 3 LEFFECT= 1 SPAN= 200. SPACE= 10. BETA= 3.515 LOADEFFECT10009. LMAX= 9732. COV= .08 Сначала я […]

Python - лучший язык программирования в мире.