Tag: regex

Pandas Python Regex: ошибка: ничего не повторять

У меня есть dataframe с несколькими странными символами, «*» и «-». import pandas as pd import numpy as np data = {'year': [2010, 2011, 2012, 2011, 2012, 2010, 2011, 2012], 'team': ['Bears', 'Bears', 'Bears', 'Packers', 'Packers', 'Lions', 'Lions', 'Lions'], 'wins': [11, '*', 10, '-', 11, 6, 10, 4], 'losses': [5, 8, 6, 1, 5, 10, […]

Pandas Чтение CSV с разделителями строк с помощью регулярных выражений

Я пытаюсь импортировать странно форматированный текстовый файл в pandas DataFrame. Ниже приведены две строки: LOADED LANE 1 MAT. TYPE= 2 LEFFECT= 1 SPAN= 200. SPACE= 10. BETA= 3.474 LOADEFFECT 5075. LMAX= 3643. COV= .13 LOADED LANE 1 MAT. TYPE= 3 LEFFECT= 1 SPAN= 200. SPACE= 10. BETA= 3.515 LOADEFFECT10009. LMAX= 9732. COV= .08 Сначала я […]

Как распечатать результаты сопоставления регулярных выражений в python 3?

Я был в IDLE и решил использовать регулярное выражение для сортировки строки. Но когда я набрал то, что сказал мне онлайн-учебник, все, что он сделал бы, это печать: <_sre.SRE_Match object at 0x00000000031D7E68> Полная программа: import re reg = re.compile("[az]+8?") str = "ccc8" print(reg.match(str)) результат: <_sre.SRE_Match object at 0x00000000031D7ED0> Может ли кто-нибудь сказать мне, как на […]

Как подстроить строку?

У меня есть строка "MenuItem {Open source}" . Как я могу получить строку Open source из моей строки? например str1 = "MenuItem {Open source}" выполните некоторые действия, чтобы установить строку 2, чтобы … print str2 # 'Open source' Как я могу добиться этого, используя python или jython?

регулярное выражение для заголовка – Python

Мне нужно найти комбинацию из двух последовательных слов заглавных слов. Это мой код до сих пор, text='Hi my name is Moh Shai and This Is a Python Code with Regex and Needs Some Expertise' rex=r'[AZ][az]+\s+[AZ][az]+' re.findall(rex,text) Это дает мне, ['Moh Shai', 'This Is', 'Python Code', 'Needs Some'] Однако мне нужны все комбинации. Что-то вроде, ['Moh […]

Удаление Unicode \ uxxxx в String из JSON с использованием Regex

У меня есть JSON-файл, в котором хранятся текстовые данные stream_key.json : {"text":"RT @WBali: Ideas for easter? Digging in with Seminyak\u2019s best beachfront view? \nRSVP: b&amp;f.wbali@whotels.com https:\/\/t.co\/fRoAanOkyC"} Поскольку мы видим, что текст в json-файле содержит unicode \u2019 , я хочу удалить этот код с помощью regex в Python 2.7, это мой код до сих пор (eraseunicode.py): […]

Удалить все реплики строки длиной более символов (регулярное выражение?)

Я не уверен, что регулярное выражение – лучший подход для этого, но, похоже, он довольно хорошо подходит. По существу, я сейчас разбираю некоторые pdf-файлы с помощью pdfminer, и недостатком является то, что эти pdf-файлы экспортируются слайдами PowerPoint, а это означает, что все анимации отображаются как довольно длинные копии строк. В идеале мне хотелось бы только […]

Возвращение уникальных совпадений с использованием regex в python

Каков наиболее эффективный (или самый Pythonic) способ создания всех уникальных совпадений регулярного выражения? Сейчас я просто применяю set() после использования findall , но я не был уверен, есть ли лучший способ.

Регулярное выражение для UK Mobile Number – Python

Мне нужно регулярное выражение, которое проверяет только мобильные номера Великобритании . Мобильный номер в Великобритании может составлять от 10-14 цифр и либо начинается с 07 , либо опускает 0 и начинается с 447 . Важно отметить, что если пользователь добавляет +44 он должен быть отклонен. Таким образом, они будут действительны: 07111111111 447111111111 и они недействительны: […]

Вставьте символ в строку до конца номера

У меня уродливая строка: oldstr = "0.100% fDrg: 2%,dgdv: 29% fGd dg 0.2%, Ghh-sf 2.2 dbgh: NONE dfgdf6 gd 3 " Мне нужно вставить char | после последней цифры числа для следующего разделения на это вставленное | , Существует также значение none , где также добавлен этот разделитель: 0.100| fdrg: 2|,dgdv: 29| fgd dg 0.2|, […]

Python - лучший язык программирования в мире.