Tag: regex

Регулярное выражение для удаления строк

Это очень интересный вопрос, и я ищу помощь экспертов, чтобы больше узнать об этом и как это сделать. У меня есть DataFrame (который я сделал при анализе данных из Big Iron … все еще существует). Теперь я хочу удалить некоторые строки, используя регулярное выражение, но не знаю, как это работает в Pandas. 24 | DRFT.146.856 […]

Строки токенизации Python

Я новичок в python и хотел бы знать, как я могу токенизировать строки на основе указанного разделителя. Например, если у меня есть строка «брат», и я хотел бы повернуть ее на «брата», «\ s»] или строку «красный / синий» на [«красный», «синий»], что бы быть наиболее подходящим способом для этого? Благодарю.

Преобразование даты из читаемой строки в более стандартную

У меня есть даты в форме Fri 27th Aug , которая является кошмаром программно, как я уверен, вы можете себе представить. Мне интересно, как лучше всего конвертировать их в форму даты в США 08/27/13 . Мне нужно указать год с месяца, т.е. август-декабрь означает 13 , а в январе-июле – 14 . Я думал о […]

Как найти название a la reStructuredText

Есть ли шаблон регулярных выражений для соответствия титров в следующем тексте reStructuredText ? Трудность состоит в том, что числа равных знаков должны быть равны длине названия. Some basic text. ========= One Title ========= For titles the numbers of sign `=` must be equal to the length of the text title. ============= Another title ============= And […]

Отображение обработчика запросов Tornado для международных символов

Я хочу иметь возможность сопоставлять URL-запросы для некоторых интернационализированных символов, например /Comisión . Это моя настройка: class Application(tornado.web.Application): def __init__(self): handlers = [ '''some handlers, and then this: ''' (r"/([\w\:\,]+)", InternationalizedHandler) ] tornado.web.Application.__init__(self, handlers, **settings) Но настройка локалей в «Торнадо», похоже, не является правильным решением. Как можно настроить регулярное выражение для захвата символов, таких как […]

Получить значения из атрибута onclick с помощью python bs4

Я не могу проанализировать атрибут onclick, чтобы получить только выбранные значения. Вот атрибут onclick onclick="try{appendPropertyPosition(this,'B10331465','9941951739','','Dealer','Murugan.N');jsb9onUnloadTracking();jsevt.stopBubble(event);}catch(e){};" Как получить только выбранные значения из этого атрибута onclick, такие как (номер телефона, '', 'Дилер', 'Имя'). Вот мой код. from bs4 import BeautifulSoup import urllib2 import re url="http://www.99acres.com/property-in-velachery-chennai-south-ffid?" page=urllib2.urlopen(url) soup = BeautifulSoup(page.read()) properties = soup.findAll('a', title=re.compile('Bedroom')) for eachproperty in properties: […]

Как создать фрейм данных pandas в python из csv с дополнительными разделителями?

У меня большой csv (порядка 400 тыс. Строк), который я хочу превратить в фрейм данных в python. Исходный файл имеет два столбца: текстовый столбец, за которым следует столбец int (или NAN). Пример: … P-X1-6030-07-A01 368963 P-X1-6030-08-A01 368964 P-X1-6030-09-A01 368965 PA-1-1011-14-G-01 368967 PA-1-1014-01-G-05 368968 PA-1-1017-02-D-01 368969 … Я хотел бы дополнительно разделить текстовый столбец на ряд […]

Регулярное выражение Python для поиска только вторых котировок парных котировок

Мне интересно, есть ли способ найти только второй кавычек из каждой пары в строке, которая имеет парные кавычки. Поэтому, если у меня есть строка типа '"aaaaa"' или просто '""' Я хочу найти только последнюю '"' из нее. Если у меня есть '"aaaa""aaaaa"aaaa""' Я хочу только вторую, четвертого и шестого '"' . Но если у меня […]

Pandas – Изменить индекс, используя шаблон / regex

С учетом кадра данных, например: >>> df ix val1 val2 val3 val4 1.31 2 3 4 5 8.22 2 3 4 5 5.39 2 3 4 5 7.34 2 3 4 5 Можно ли редактировать индекс, используя что-то вроде замены ? Псевдокод: (поскольку индекс df не имеет атрибута str) df.index=df.index.str.replace("\\.[0-9]*","") Мне нужно что-то вроде: >>> […]

Регулярное регулярное выражение Url в django

Это основной вопрос, но мне трудно найти ответ в документах: Допустим, у меня есть URL-адрес: http://example.com/part1/part2 и я имею: urlpatterns = patterns('', # Examples: url(r'^$', 'xxx', name='yyy'), ) Какую часть строки url выше пытают соответствовать регулярным выражением между ^ и $ ? Я прочитал множество источников и документов, включая: https://docs.djangoproject.com/en/1.6/intro/tutorial03/ https://docs.djangoproject.com/en/1.6/ref/urlresolvers/#module-django.core.urlresolvers http://www.djangobook.com/en/2.0/chapter03.html .

Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.