Tag: regex

строка регулярных выражений и подстрока

У меня есть строка символов 'aabaacaba' . Начиная с левой стороны, я пытаюсь получить подстроки всех размеров> = 2, которые появляются позже в строке. Например, aa появляется снова в строке, и так происходит с ab . Я написал следующий код регулярного выражения: re.findall(r'([az]{2,})(?:[az]*)(?:\1)', 'aabaacaba') и я получаю ['aa'] в качестве ответа. Регулярное выражение пропускает ab […]

Python – способ узнать и обнаружить текстовые шаблоны?

Проблема: Мне дается длинный список различных наименований позиций для работы в ИТ-индустрии (поддержка или разработка); Мне нужно автоматически классифицировать их на основе общего типа работы, которую они представляют. Например, аналитик ИТ-поддержки, аналитик службы поддержки … и т. Д. Все они могут принадлежать группе IT-Support . Текущий подход: В настоящее время я вручную создаю шаблоны регулярных […]

"найти . -regex … "в Python или Как найти файлы, чье имя (путь + имя) соответствует регулярному выражению?

Я хотел бы найти файлы, чье имя (относительное, хотя и абсолютное тоже хорошо) соответствует заданному регулярному выражению (т. glob Подобно модулю glob , но для совпадений регулярных выражений вместо совпадений подстановок оболочки). Используя find , можно сделать, например: find . -regex ./foo/\w+/bar/[0-9]+-\w+.dat Конечно, я мог бы использовать find через os.system(…) или os.exec*(…) , но я […]

Разделение строк на Python

Я изо всех сил пытаюсь разделить текстовые строки на основе разделителя переменных и сохранить пустые поля и данные с котировками. Примеры: 1,"2",three,'four, 4',,"6\tsix" или в виде разделителя с разделителями табуляции 1\t"2"\tthree\t'four, 4'\t\t"6\tsix" Если оба результата приведут к: ['1', '"2"', 'three', 'four, 4', '', "6\tsix"] До сих пор я пробовал: Использование split, но ясно, что указанные […]

re.search Несколько строк Python

re.search с \ s или '\ n' не находит многострочную систему, которую я пытаюсь выполнить. Часть источника: Date/Time: 2013-08-27 17:05:36 —– BEGIN SEARCH —– GENERAL DATA: NAME: AB12 SECTOR: 999,999 CONTROLLED BY: Player ALLIANCE: Aliance ONLINE: 1 seconds ago SIZE: Large HOMEWORLD: NO APPROVAL RATING: 100% PRODUCTION RATE: 100% RESOURCE DATA: POWER: 0 / 0 […]

Регулярное выражение для выделения последнего встречающегося числа с использованием Python

У меня есть регулярное выражение, которое отделяет число от данной строки. username = "testuser1" xp = r'^\D+' ma = re.match(xp, username) user_prefix = ma.group(0) print user_prefix выход testuser Но если имя пользователя что-то вроде ниже username = "testuser1-1" Я получаю следующий результат testuser что ожидается. Но я ищу следующие testuser1- В основном регулярное выражение должно […]

Использование Python для удаления всех строк, соответствующих Regex

Я пытаюсь удалить все строки, где совпадает мое регулярное выражение (регулярное выражение просто ищет любую строку, в которой есть yahoo). Каждый матч находится на собственной линии, поэтому нет необходимости в многострочном варианте. Это то, что у меня есть до сих пор … import re inputfile = open('C:\\temp\\Scripts\\remove.txt','w',encoding="utf8") inputfile.write(re.sub("\[(.*?)yahoo(.*?)\n","",inputfile)) inputfile.close() Я получаю следующую ошибку: Traceback (последний […]

Python regex '\ s' не соответствует спецификации Unicode (U + FEFF)

В документации модуля Python re module указано, что когда re.UNICODE флаг re.UNICODE , '\s' будет соответствовать: все, что классифицируется как пространство в базе данных свойств символов Юникода. Насколько я могу судить, спецификация (U + FEFF) классифицируется как пространство . Однако: re.match(u'\s', u'\ufeff', re.UNICODE) оценивает значение None . Это ошибка в Python или я что-то упускаю?

Поиск регулярного выражения Python для строки в начале строки в файле

Вот мой код: #!/usr/bin/python import io import re f = open('/etc/ssh/sshd_config','r') strings = re.search(r'.*IgnoreR.*', f.read()) print(strings) Это возвращает данные, но мне нужно определенное соответствие регулярному выражению: например: ^\s*[^#]*IgnoreRhosts\s+yes Если я просто изменю свой код: strings = re.search(r'^IgnoreR.*', f.read()) или даже strings = re.search(r'^.*IgnoreR.*', f.read()) Я ничего не получаю. Мне нужно иметь возможность использовать реальные регулярные […]

Использование Mongo Find () с помощью $ in и Regex

Я столкнулся с проблемой. У меня есть массив слов, и я использую эти слова для поиска в базе данных и сопоставления любых документов с соответствующими полями, используя: collection.find({"word":{"$in":words}}) Вышеупомянутое работает очень хорошо, но я хочу иметь возможность использовать Regex. Проблема, которую я имею сейчас, заключается в том, что, скажем, одно из слов в массиве было […]

Python - лучший язык программирования в мире.