Википедия с Python

У меня есть этот очень простой код python для чтения xml для википедии api:

import urllib from xml.dom import minidom usock = urllib.urlopen("http://en.wikipedia.org/w/api.php?action=query&titles=Fractal&prop=links&pllimit=500") xmldoc=minidom.parse(usock) usock.close() print xmldoc.toxml() 

Но этот код возвращается с этими ошибками:

 Traceback (most recent call last): File "/home/user/workspace/wikipediafoundations/src/list.py", line 5, in <module><br> xmldoc=minidom.parse(usock)<br> File "/usr/lib/python2.6/xml/dom/minidom.py", line 1918, in parse<br> return expatbuilder.parse(file)<br> File "/usr/lib/python2.6/xml/dom/expatbuilder.py", line 928, in parse<br> result = builder.parseFile(file)<br> File "/usr/lib/python2.6/xml/dom/expatbuilder.py", line 207, in parseFile<br> parser.Parse(buffer, 0)<br> xml.parsers.expat.ExpatError: syntax error: line 1, column 62<br> 

Я понятия не имею, как просто изучать питон. Есть ли способ получить более подробную информацию об ошибке? Кто-нибудь знает решение? Кроме того, пожалуйста, порекомендуйте лучший язык для этого.

Спасибо,
Венкат Рао

One Solution collect form web for “Википедия с Python”

URL-адрес, который вы запрашиваете, представляет собой HTML-представление XML, который будет возвращен:

 http://en.wikipedia.org/w/api.php?action=query&titles=Fractal&prop=links&pllimit=500 

Таким образом, синтаксический анализатор XML не работает. Вы можете увидеть это, вставив выше в браузер. Попробуйте добавить format=xml в конце:

 http://en.wikipedia.org/w/api.php?action=query&titles=Fractal&prop=links&pllimit=500&format=xml 

как указано на связанной странице:

  • Как использовать Xpath в Python?
  • Python lxml (objectify): проблемы с Xpath
  • Импорт большого файла xml в Neo4j с Py2neo
  • LXML - Порядок сортировки тегов
  • генерировать xml с sax2 в python
  • Сопряжение значений дочернего элемента и вложенного дочернего элемента из проанализированных XML-файлов
  • У SimplerXMLGenerator нет атрибута '_write'
  • Как обрабатывать различные исключения, возникающие в разных версиях Python
  • Анализ разбитого XML с помощью lxml.etree.iterparse
  • Почему lxml.etree.iterparse () съедает всю мою память?
  • В чем разница между cElementtree и ElementTree?
  • Python - лучший язык программирования в мире.