Tag: regex

Как преобразовать регулярное выражение python в java

Мне нужно преобразовать следующий python regexp в java regexp: regexp = re.compile(r"^(?P<prefix>(%s)(%s)?)\s?\b(?P<name>.+)" % ("|".join(array1), "|".join(array2)), re.IGNORECASE | re.UNICODE) где array1 и 2 – массивы строк. Что я сделал: String regexp = String.format("^(?<prefix>(%s)(%s)?)\\s?\\b(?<name>.+)", array1, array2); regexpPattern = Pattern.compile(regexp, Pattern.CASE_INSENSITIVE); Но я получаю исключение PatternSyntaxException: «Неизвестная внешняя группа рядом» в вопросительном знаке (% s) (% s) ? […]

Строка соответствия содержит x и за ней следует y

Я хочу оценить значение true, если строка содержит слово «except» AND, за которым следует «xyz». Например blah except xyz => true except xyz => true blah except abc => false blah except abc, xyz => true blah except xyz, abc => true xyz except abc => false Какой самый питонический способ сделать это? Регулярные выражения […]

python RE vs html5 RE

кажется, что я получил ошибку в python: (Python 2.7.3 (по умолчанию, 10 апреля 2012, 23:24:47) [MSC v.1500 64 бит (AMD64)] на win32) >>> re.match("0[5-7][5-9][0-9]{7}", "0775123456") #match <_sre.SRE_Match object at 0x0000000002D3FC60> >>> re.match("0[5-7][5-9][0-9]{7}", "077512345") #dont match >>> re.match("0[5-7][5-9][0-9]{7}", "07751234567") #match! <_sre.SRE_Match object at 0x0000000002D3F920> >>> re.match("0[5-7][5-9][0-9]{7}","07751234567777777777777777777777777777777777777777777777") #match!! <_sre.SRE_Match object at 0x0000000002D3FC60> поэтому я должен использовать знак […]

Извлечь GPS-координаты из файла .docx с помощью python

У меня есть какая-то тяжелая задача, для которой мне нужна помощь от python. См. Этот документ. Я должен извлекать тексты и координаты GPS из каждой строки. В настоящее время существует более 100 координат в файле 10 docx. Мое «здоровенное» знание python подталкивает меня к этому. from docx import Document import re main_file = Document("D:/DOCUMENTS/Google_Link/1 Category […]

Перетаскивание фрейма данных в Pandas (Python)

У меня есть следующие данные в файле csv: from StringIO import StringIO import pandas as pd the_data = """ ABC,2016-6-9 0:00,95,{'//Purple': [115L], '//Yellow': [403L], '//Blue': [16L], '//White-XYZ': [0L]} ABC,2016-6-10 0:00,0,{'//Purple': [219L], '//Yellow': [381L], '//Blue': [90L], '//White-XYZ': [0L]} ABC,2016-6-11 0:00,0,{'//Purple': [817L], '//Yellow': [21L], '//Blue': [31L], '//White-XYZ': [0L]} ABC,2016-6-12 0:00,0,{'//Purple': [80L], '//Yellow': [2011L], '//Blue': [8888L], '//White-XYZ': [0L]} […]

Извлечь первую дату из строки в кадре данных

Я хочу извлечь первую дату в формате yyyy-mm-dd из фрейма данных (Pandas). Когда дата не найдена, просто верните пустую строку. Это пример данных, хранящихся в фрейме данных. 1976-05-17 [ ] [ ] 1976-05-172 1976-05-17 1976-05-17 Atlanta, Georgia US 1976-05-17 1975-07-11 ( 1976-05-17 ) 1976-05-17 (age 38) [ ] Во всех случаях я хочу 1976-05-17 или […]

Разбирайте объявление javascript-объекта, которое не использует строки для имен свойств (используя python и BeautifulSoup)

Я делаю что-то очень похожее на то, что делает этот пользователь : пытается загрузить объявление javascript-объекта в словарь python. Однако, в отличие от этого пользователя, имена свойств не заключены в кавычки. >>> simplejson.loads('{num1: 1383241561141, num2: 1000}') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/Users/lalalal/site-packages/simplejson/__init__.py", line 385, in loads return _default_decoder.decode(s) […]

Поиск папок на основе предопределенной структуры папок

У нас есть синтаксис динамической структуры папок, например: :projectRoot:/dev/model/:parentHierarchy:/:assetName:/data/obj :projectRoot:/dev/model/:parentHierarchy:/:assetName:/data/fbx :projectRoot:/asset/shots/:parentHierarchy:/animation/:assetName:/scenes :projectRoot:/asset/shots/:parentHierarchy:/rendering/:assetName:/scenes Где слова между двумя двоеточиями: «являются переменными. Теперь, основываясь на одном пути, я хочу получить projectRoot, parentHierarchy и propertyName. Переменная projectRoot и переменная parentHierarchy позволяют присутствовать 1 или более папок, чтобы она могла содержать подпапки. Переменная assetName ограничена одной папкой. Они определены как […]

разбор недопустимого тега привязки с помощью BeautifulSoup или Regex

Мне нужен синтаксический анализ сырого документа, содержащего тег html anchor, но, к сожалению, он содержит недопустимый тег, например: <a href="A 4"drive bay">some text here</a> Я знаю, что значение href не может быть реальной ссылкой, но давайте просто оставим это таким образом. теперь мне нужно получить значение href 'A 4"drive bay' и текст ссылки 'some text […]

Может ли pexpect сказать, чтобы игнорировать шаблон или сигнал?

Я пытаюсь написать скрипт python для доступа к нескольким сетевым устройствам Cisco. К сожалению, устройства не настроены одинаково, у некоторых есть баннеры, которые появляются в странных местах. Эти баннеры могут иметь шаблоны, которые имеют некоторые из тех же материалов, которые могут иметь подсказки. Например, как только я вхожу в систему, я ожидаю приглашение 'hostname#' , […]

Python - лучший язык программирования в мире.