Tag: regex

Как я могу получить часть регулярного выражения как переменную в python?

В Perl можно сделать что-то вроде этого (я надеюсь, что синтаксис прав …): $string =~ m/lalala(I want this part)lalala/; $whatIWant = $1; Я хочу сделать то же самое в Python и получить текст внутри скобки в строке, например, $ 1.

Совместимость с PHP preg_match в Python

Я планирую перенести один из моих скребок на Python. Мне удобно использовать preg_match и preg_match_all в PHP. Я не нашел подходящую функцию в Python, похожую на preg_match . Может ли кто-нибудь помочь мне в этом? Например, если я хочу получить контент между <a class="title" и </a> , я использую следующую функцию в PHP: preg_match_all('/a class="title"(.*?)<\/a>/si',$input,$output); […]

Как обнаружить идентичную часть (-ы) внутри строки?

Я пытаюсь разбить заданный алгоритм декодирования на более мелкие вопросы. Это часть I. Вопрос: две строки: s1 и s2 часть s1 идентична части s2 пространство – разделитель как извлечь идентичную часть (ы)? пример 1: s1 = "12 November 2010 – 1 visitor" s2 = "6 July 2010 – 100 visitors" the identical parts are "2010", […]

Соответствие строки Python

Если строка содержит *SUBJECT123 , как определить, что строка содержит subject в python?

Как использовать регулярное выражение python для замены с помощью захваченной группы?

Предположим, я хочу сменить the blue dog and blue cat wore blue hats the gray dog and gray cat wore blue hats . С помощью sed я мог бы выполнить это следующим образом: $ echo 'the blue dog and blue cat wore blue hats' | sed 's/blue \(dog\|cat\)/gray \1/g' Как я могу сделать аналогичную замену […]

Django url pattern regex, чтобы передать электронное письмо в качестве параметра в URL-адресе

Я пишу представление, которое принимает электронное письмо в качестве параметра, передаваемого по URL-адресу url(r'^admin/detail_consultant_service/((?P<consultant_id>\[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[AZ]{2,4}))/$', 'admin_tool.views.consultant_service_detail', name="consultant_service_detail"), И вот содержание моего шаблона {% for consultant in list_consultants %} <li> {{consultant.id}} <a href="{% url consultant_service_detail consultant.id %}">{{ consultant|disp_info }}</a> <br/> </li> {% endfor %} BUt Когда я получаю доступ к URL-адресу, я получаю сообщение об ошибке everse […]

Написание правил грамматики для контекстно-зависимых элементов с использованием Pyparsing

Я пытаюсь написать грамматику для набора предложений и использовать Pyparsing для ее анализа. Эти предложения говорят, что и как искать в текстовом файле, и мне нужно преобразовать их в соответствующие коды поиска регулярных выражений. Однако есть некоторые элементы, которые на самом деле не являются контекстно-зависимыми, и, следовательно, мне трудно писать правила производства для них. В […]

Очистка HTML-кода Python

На самом деле это не очистка, я просто пытаюсь найти URL-адреса на веб-странице, где класс имеет определенное значение. Например: <a class="myClass" href="/url/7df028f508c4685ddf65987a0bd6f22e"> Я хочу получить значение href. Есть идеи, как это сделать? Может быть, регулярное выражение? Не могли бы вы разместить пример кода? Я предполагаю, что html scraping libs, такие как BeautifulSoup, немного перегружены только […]

регулярное выражение соответствует первому и последнему слову или любому слову

У меня огромный файл со списком таких данных, как: #fabulous 7.526 2301 2 #excellent 7.247 2612 3 #superb 7.199 1660 2 #perfection 7.099 3004 4 #terrific 6.922 629 1 У меня есть файл, содержащий список предложений вроде этого: Terrific Theo Walcott is still shit, watch Rafa and Johnny deal with him on Saturday. its not […]

Патологическое регулярное выражение, которое взрывается (время и память)?

Что такое патологическое регулярное выражение, которое взрывает много парсеров (как во времени, так и в памяти)? и какие парсеры? Бонус указывает на более основное и стандартное регулярное выражение, и более вероятно, что не злонамеренный пользователь может невинно придумать его. Не стесняйтесь публиковать фактическое время и данные памяти, а также версию парсера. (Я, кажется, помню, что […]

Python - лучший язык программирования в мире.