Tag: regex

Нужна помощь в понимании фрагмента python с регулярным выражением и cURL

EDIT – просто добавлена ​​вся функция cURL для справки / дополнительной информации, но нужна помощь с операторами if – regex Ищите помощь для понимания инструкций if в этом cURL. Я прочитал некоторую документацию на python, и я понимаю каждую из частей, что это поиск с регулярным выражением и замена. Просто надеюсь, что кто-то может помочь […]

Поиск заголовков в базе данных medline с помощью entrez и biopython

Я пытаюсь искать документы со специальными словами в названии. Точнее, слово вирус или вирус в публикациях, опубликованных в период с 2010 по 2015 год. Вот код, который у меня есть: import re from Bio import Medline handle = Entrez.esearch(db="pubmed", # database to search term="2010[Date – Publication]:2015[Date – Publication]" ) record = Entrez.read(handle) handle.close() pmid_list = […]

Очистить информацию от сложного веб-сайта без направляющей структуры HTML

Мне нужно очистить некоторую информацию с очень сложного веб-сайта Это пример: <div class="overview"> <span class="course_titles">Courses:</span> <a href="/schools/courses/173/" class="course_name">Math101</a> (Math; Monday; Room 10); <a href="/schools/student/1388/" class="coursestudent_name">Mark</a> 17, <a href="/schools/student/1401/" class="coursestudent_name">Alex</a> 18, ), <a href="/schools/courses/2693/" class="course_name">English101</a> (English; Thursdays; Room 12); <a href="/schools/student/1403/" class="coursestudent_name">Sarah</a> 16, <a href="/schools/student/1411/" class="coursestudent_name">Nancy</a> 17, <a href="/schools/student/1390/" class="coursestudent_name">Casey</a> 17 ), </div> На каждом курсе […]

Поиск регулярных выражений

Я пытаюсь найти определенную строку с RegEx. Я хочу найти «что-то начинающееся с« f »и заканчивающееся первым 2» (оно должно содержать только одно 2). В этом примере я хочу найти result = "fdba12" но код ниже дает мне 'fdba12312' (содержащий два 2). Как я могу остановить поиск, когда сразу найду 2? import re string2 = […]

Как использовать raw_input с регулярными выражениями?

с raw_input() Мне нужно ввести '\ t', чтобы разделить одну строку. '\ t' является регулярным выражением. Когда обеспечивается через raw_input() python преобразует \t в '\\t' , поэтому я не могу разбить строку. line = '01/09/2015\t02:00\t0\t0\t0\t0\t0\t0\t1150592' INPUT_separator = raw_input("- Separating character = ") x = pd.DataFrame(line.split(INPUT_separator )).transpose()

Регулярное выражение для сопоставления между комбинацией котировок

[ Следуйте за моим старым вопросом с лучшим описанием и ссылками ] Попытка сопоставить любой символ (включая символы новой строки, символы табуляции, пробелы и т. Д.) Между двумя символами, включая эти символы. Например: foobar89 \ п \ nfoo \ TBAR; '' 'blah blah blah'8 & ^ "' '' необходимо сопоставить '' blah blah blah'8 & […]

Как я могу использовать регулярное выражение / Python для поиска всех целых чисел после известной строки, неизвестной строки и другой известной строки?

Я новичок в регулярном выражении / Python, но я пытаюсь извлечь номер версии с HTML-страницы. Я использовал прокси и urllib для хранения прочитанной страницы в строке. У меня есть текст, который выглядит так: <p>Proxy 3.2.1 r72440<br> SlotBios 11.00</p> <p><strong><span style="color: rgb(255, 0, 0);">Random Text 4.23.6 r98543<br> …</tr>… <p><strong><span style="color: rgb(255, 0, 0);">Random Text 4.33.6 r98549<br> […]

Объединить Dataframe с помощью регулярного выражения или нечеткого соответствия

У меня есть d1 и d2, и я хочу объединить два столбца по идентификатору. Однако идентификаторы и ID2 не совпадают. Вместо этого идентификатор – это первая 8-разрядная цифра ID2 (иногда это может быть первая цифра 6 или иногда это может быть одна или две цифры). Я понимаю, что я могу предварительно обработать ID2, чтобы сохранить […]

Именование групп с групповым и вложенным регулярным выражением (преобразование единиц из текстового файла)

Основной вопрос: Как вы можете назвать группу regex python с другим значением группы и вложить ее в большую группу регулярных выражений? Происхождение вопроса: Для такой строки, как 'Your favorite song is 1 hour 23 seconds long. My phone only records for 1 h 30 mins and 10 secs.' 'Your favorite song is 1 hour 23 […]

Использовать регулярное выражение в Python для исключения строки

Я использую pandas для очистки данных, как показано ниже: s3 = pd.DataFrame({'title':["intermediate" ,"Basmati/sadri" ,"temperate japonica" ,"Temperate japonica" , "Japonica" ,"Tropical japonica" ,"Aromatic (basmati/sandri type" , "indica" , "Aus/boro" , "Aus" ,"aus" ,"japonica" , "tropical japnica", "" , "Indica" , "Intermediate type" ]}) s3.title.replace(r".*[Jj]ap(o)?nica$", "japonica" ,inplace=True,regex=True) s3.title.replace(r"Indica", "indica" ,inplace=True,regex=True) print s3 И я получил: title 0 […]

Python - лучший язык программирования в мире.