Tag: regex

Строковые подстановки на основе объекта-сопоставления (Python)

Я пытаюсь понять group метод в библиотеке регулярных выражений Python. В этом контексте я пытаюсь выполнять подстановки в строке в зависимости от соответствующего объекта. То есть, я хочу заменить сопоставленные объекты ( + и \n в этом примере) на определенную строку в словаре my_dict (с rep1 и rep2 соответственно). Как видно из этого вопроса и […]

Извлечение текста между тегами с помощью BeautifulSoup

Я пытаюсь извлечь текст из серии веб-страниц, которые следуют аналогичному формату с помощью BeautifulSoup. Html для текста, который я хочу извлечь, приведен ниже. Фактическая ссылка находится здесь: http://www.p2016.org/ads1/bushad120215.html . <p><span style="color: rgb(153, 153, 153);"></span><font size="-1"> <span style="font-family: Arial;"><big><span style="color: rgb(153, 153, 153);"></span></big></span></font><span style="color: rgb(153, 153, 153);"></span><font size="-1"><span style="font-family: Arial;"><big><span style="color: rgb(153, 153, 153);"></span></big></span></font><font size="-1"><span style="font-family: […]

Как добавить конечную косую черту для приложения для категоризации Django MPTT?

Я использую Django-MPTT для разработки приложения для категоризации для моего проекта Django. Но я не могу получить шаблон регулярного выражения для добавления конечной косой черты, которая также не разбивается на дочерние категории. Вот пример URL: http://mydjangoapp.com/categories/parentcat/childcat/ Я хотел бы иметь возможность использовать http://mydjangoapp.com/categories/parentcat и перенаправить его в конечную косую черту. То же самое относится к […]

Установите новый модуль регулярных выражений с помощью setup.py

Я пытаюсь установить новый модуль Regex В readme.txt говорится :: To build and install regex for your default Python run python setup.py install To install regex for a specific version run setup.py with that interpreter, eg python3.1 setup.py install Я /Library/Frameworks/Python.framework/Versions/7.3/Resources/Python.app/Contents/MacOS/Python: can't open file 'setup.py': [Errno 2] No such file or directory python setup.py install […]

Сортировка буквенно-цифровых клавиш словаря в python

У меня есть словарь python, ключи которого имеют следующий шаблон <some x number of digits/alphabets> <some y number of alphabets><some z number of digits> Я хочу сортировать словарь на основе этих ключей. Например, для 01IB0610, 01IB062, 01IB064 должен быть 01IB062, 01IB064 01IB0610 Полный пример: { '01IB0610' : {'a' : [] , 'b': [] }, '01IB062' […]

Как извлечь родительский тег html в Python, сопоставляя строку

Мне нужно извлечь родительские теги в html, сопоставив строку в html. (т. е. у меня много сырых html-источников. Каждый источник содержит текстовое значение «VIN: * » ** с некоторыми символами. Это текстовое значение (VIN: * ) помещается в различные форматы в каждом источнике, например «<ul>», «<div>» и т. Д. Затем мне нужно извлечь все значения […]

Замена текста с использованием регулярного выражения в Python с именованными параметрами

У меня есть строка "(r'^users/', include('users.urls'))," . Я хочу, чтобы пользователь мог изменить его, чтобы сказать "(r'^users_part_has_been_changed_by_user/', include('users.urls'))," Регулярное выражение: '\s*[url]?\(r?["|\'](?P<pattern>[^\'"]+)["|\'],\s*include\(["|\'](?P<include>[^\'"]+)["|\']\)\),'

Scrapy Deploy не соответствует результату отладки

Я использую Scrapy для извлечения некоторых данных с сайта, например «myproject.com». Вот логика: Перейдите на главную страницу, и есть список categorylist которые будут использоваться для создания второй волны ссылок. Для второго раунда ссылок они обычно являются первой страницей из каждой категории. Кроме того, для разных страниц внутри этой категории они следуют одному и тому же […]

как я зацикливаю re.search для следующих данных

У меня есть 2 набора данных, которые я сканировал из таблицы html, используя выражение регулярного выражения данные: <div class = "info"> <div class="name"><td>random</td></div> <div class="hp"><td>123456</td></div> <div class="email"><td>random@mail.com</td></div> </div> <div class = "info"> <div class="name"><td>random123</td></div> <div class="hp"><td>654321</td></div> <div class="email"><td>random123@mail.com</td></div> </div> регулярное выражение: matchname = re.search('\<div class="name"><td>(.*?)</td>' , match3).group(1) matchhp = re.search('\<div class="hp"><td>(.*?)</td>' , match3).group(1) matchemail = […]

Pymongo Regex $ все несколько поисковых запросов

Я хочу искать MongoDB, чтобы получить только результаты, где все x находятся в некоторой конфигурации вместе с ключом. collected_x = '' for x in input: collected_x = collected_x + 're.compile("' + x + '"), ' collected_x_cut = collected_x[:-2] cursor = db.collection.find({"key": {"$all": [collected_x_cut]}}) Это не приносит ожидаемого результата. Если я сам вводю несколько x, он […]

Python - лучший язык программирования в мире.