Tag: xml

Создание XML-кода Unicode с нуля с помощью Python 3.2

Поэтому в основном я хочу сгенерировать XML с элементами, генерируемыми из данных в словаре python, где то, что станет тегами, – это словарные ключи, а текст – значения словаря. Мне не нужно давать атрибуты элементам, и мой желаемый результат будет выглядеть примерно так: <AllItems> <Item> <some_tag> Hello World </some_tag> … <another_tag /> </Item> <Item> … […]

Как анализировать XML-корм с помощью python?

Я пытаюсь разобрать этот xml (http://www.reddit.com/r/videos/top/.rss), и у меня возникают проблемы. Я пытаюсь сохранить ссылки на YouTube в каждом из элементов, но у меня возникают проблемы из-за дочернего узла «channel». Как мне добраться до этого уровня, чтобы затем я мог перебирать элементы? #reddit parse reddit_file = urllib2.urlopen('http://www.reddit.com/r/videos/top/.rss') #convert to string: reddit_data = reddit_file.read() #close file […]

Структура данных Python: файл SQL, XML или .py

Каков наилучший способ хранения больших объемов данных в python, учитывая один (или два) 500 000 слов + словарь, используемый для поиска неориентированного графика? Я рассматривал несколько вариантов, таких как хранение данных в формате XML: <key name="a"> <value data="1" /> <value data="2" /> </key> <key name="b"> … или в файле python для прямого доступа: db = […]

Разбор RDF-файла в python

Кто-нибудь знает, как обрабатывать RDF-файл в Python, чтобы получить все значения в определенном теге? благодаря

LXML убивает мои секции CDATA

Я пакетно-конвертирую много XML-файлов, меняя их кодировки символов на UTF-8: with open(source_filename, "rb") as source: tree = etree.parse(source) with open(destination_filename, "wb") as destination: tree.write(destination, encoding="UTF-8", xml_declaration=True) К сожалению, это разрушает мои разделы CDATA и просто ускользает от них. Источник : <d><![CDATA[áÌÀøÅàùÑÄéú ëÌÄé áÈàÅùÑ éäå''ä ðÄùÑÀôÌÈè <small><small>(ùí ëå èæ)</small></small> Место назначения : <d>בְּרֵאשִׁית כִּי בָאֵשׁ יהו''ה […]

BeautifulSoup FindAll

У меня есть xml: <article> <uselesstag></uslesstag> <topic>oil, gas</topic> <body>body text</body> </article> <article> <uselesstag></uslesstag> <topic>food</topic> <body>body text</body> </article> <article> <uselesstag></uslesstag> <topic>cars</topic> <body>body text</body> </article> Есть много, много ненужных тегов. Я хочу использовать beautifulsoup, чтобы собрать весь текст в тегах тела и связанный с ним текст темы, чтобы создать новый xml. Я новичок в python, но я […]

Как следует анализировать эту строку xml в python?

Моя строка XML – xmlData = """<SMSResponse xmlns="http://example.com" xmlns:i="http://www.w3.org/2001/XMLSchema-instance"> <Cancelled>false</Cancelled> <MessageID>00000000-0000-0000-0000-000000000000</MessageID> <Queued>false</Queued> <SMSError>NoError</SMSError> <SMSIncomingMessages i:nil="true"/> <Sent>false</Sent> <SentDateTime>0001-01-01T00:00:00</SentDateTime> </SMSResponse>""" Я пытаюсь разобрать и получить значения тегов – Canceled, MessageId, SMSError и т. Д. Я использую библиотеку Elementtree python. До сих пор я пробовал такие вещи, как: root = ET.fromstring(xmlData) print root.find('Sent') // gives None for child […]

снятие встроенных тегов с помощью lxml python

Я должен иметь дело с двумя типами встроенных тегов в XML-документах. Первый тип тегов заключает текст, который я хочу сохранить между ними. Я могу справиться с этим с помощью lxml's etree.tostring(element, method="text", encoding='utf-8') Второй тип тегов включает текст, который я не хочу хранить. Как я могу избавиться от этих тегов и их текста? Я бы […]

как получить конкретные узлы в xml-файле с помощью python

im ищет способ получить определенные теги .. из очень большого документа xml с встроенным модулем python dom например : <AssetType longname="characters" shortname="chr" shortnames="chrs"> <type> pub </type> <type> geo </type> <type> rig </type> </AssetType> <AssetType longname="camera" shortname="cam" shortnames="cams"> <type> cam1 </type> <type> cam2 </type> <type> cam4 </type> </AssetType> Я хочу получить значение дочерних узлов узла AssetType, […]

Проверьте, существует ли дочерний тег в beautifulsoup

У меня есть XML-файл с определенной структурой, но различное количество тегов, например file1.xml: <document> <subDoc> <id>1</id> <myId>1</myId> </subDoc> </document> file2.xml: <document> <subDoc> <id>2</id> </subDoc> </document> Теперь мне нравится проверять, выходит ли тег myId . Поэтому я сделал следующее: data = open("file1.xml",'r').read() xml = BeautifulSoup(data) hasAttrBs = xml.document.subdoc.has_attr('myID') hasAttrPy = hasattr(xml.document.subdoc,'myID') hasType = type(xml.document.subdoc.myid) Результат для […]

Python - лучший язык программирования в мире.