Tag: regex

Юникодное регулярное выражение для соответствия символьному классу китайских символов

^[一二三四五六七]、 не соответствует 一、 Но ^一、 соответствует 一、 . Является ли мой способ указать класс символов китайских символов неправильно? Я читал регулярное выражение из файла.

множественное разделение в строке с использованием регулярного выражения

У меня есть строка: Station Disconnect:1.3.6.1.4.1.11.2.14.11.15.2.75.3.2.0.8 StaMAC:00:9F:0B:00:38:B8 BSSID:00 9F Radioid:2 Я хочу разделить эту строку. Это выглядит так: 'Station Disconnect:1.3.6.1.4.1.11.2.14.11.15.2.75.3.2.0.8' 'StaMAC:00:9F:0B:00:38:B8' 'BSSID:00 9F' 'Radioid:2' Я пробовал эту логику – msgRegex = re.compile ('[\ w \ s] +:') и функцию split. Как я могу помочь

множественная замена регулярных выражений в нескольких файлах с использованием python

У меня есть один проект, где мне нужно применить примерно дюжину регулярных выражений к примерно 100 файлам с помощью python. 4 часа поиска в Интернете для различных комбинаций, включая «(merge | concatenate | stack | join | compile) множественное регулярное выражение в python», и я не нашел сообщений о моей потребности. Для меня это проект […]

Как сопоставить смайлик в предложении с регулярными выражениями

Я использую Python для обработки предложений Weibo (twitter-like service in China). В предложениях есть некоторые смайлики, соответствующий юникод которых – \ue317 и т. Д. Чтобы обработать предложение, мне нужно закодировать предложение с помощью gbk, см. Ниже: string1_gbk = string1.decode('utf-8').encode('gb2312') Там будет UnicodeEncodeError:'gbk' codec can't encode character u'\ue317' Я пробовал \\ue[0-9a-zA-Z]{3} , но это не сработало. […]

Python web scraping, считая появление списка слов на каждой странице

Поэтому я пытаюсь найти набор конкретных слов («должен», «может» «должен» и т. Д.) Каждой страницы и добавить его появление, код, который я использовал: import requests from bs4 import BeautifulSoup, SoupStrainer import re def levelfour(main_url): pattern = re.compile(r"\bmay not\b", re.IGNORECASE) pattern1 = re.compile(r"\bshall\b", re.IGNORECASE) pattern2 = re.compile(r"\bmust\b", re.IGNORECASE) pattern3 = re.compile(r"\bprohibited\b", re.IGNORECASE) pattern4 = re.compile(r"\brequired\b", re.IGNORECASE) […]

Как отделить выходные данные

Вот мой код: #——————————————————————————- # Name: Mocha Rotoscoping Via Blender # Purpose: Make rotoscoping more efficient # # Author: Jeff Owens # # Created: 11/07/2011 # Copyright: (c) jeff.owens 2011 # Licence: Grasshorse #——————————————————————————- #!/usr/bin/env python import sys import os import parser sys.path.append('Z:\_protomotion\Prog\HelperScripts') import GetDir sys.path.append('Z:/Blender_Roto') filename = 'diving_board.shape4ae' infile = 'Z:/Blender_Roto/' #import bpy #from […]

Извлечь дату и значение валюты (разделенные запятой) из файла

Задача: Извлечь данные строки, значение валюты, [тип валюты] и дату. Содержание файла: [["1234567890","Your previous month subscription point is <RS|$|QR|#> 5,200.33.Your current month month subscription point is <RS|$|QR|#> 1,15,200.33, Last Year total point earned <RS|$|QR|#> 5589965.26 and point lost in game is <RS|$|QR|#> 11520 your this year subscription will expire on 19-04-2013. 9. Back"],["1234567890","Your previous month […]

Замена HTML-тегов с использованием регулярных выражений и python

У меня есть сценарий Python, который будет смотреть на файл HTML, который имеет следующий формат: <DOC> <HTML> … </HTML> </DOC> <DOC> <HTML> … </HTML> </DOC> Как удалить все теги HTML (заменить теги на «) за исключением открывающих и закрывающих тегов DOC с использованием регулярного выражения в Python? Кроме того, если я хочу сохранить альт-текст тега, […]

re.split не работает должным образом со строкой, поступающей из ячейки excel

У меня есть строка: 05-01-2015 12:27 – KH – (KH) Igangværende – Opringning – 13-11 00:00 Fangede RLI på hans mobil. Кольцо igen kl. 15 19-11-2014 11:17 – KH – (KH) Igangværende – Opringning – 13-11 00:00 Gik på svarer igen og lagt besked til RLI на ринге. 12-11-2014 09:38 – KH – (KH) Igangværende […]

Как читать файл и извлекать данные между многострочными шаблонами?

У меня есть файл, из которого мне нужно извлечь одну часть данных, ограничив (возможно) многострочными фиксированными шаблонами some data … [my opening pattern is here and can be multiline] the data I want to extract [my ending pattern which can be multiline as well] … more data Эти шаблоны фиксированы в том смысле, что контент […]

Python - лучший язык программирования в мире.