Как разбить веб-адрес

Поэтому я использую python для разбора веб-страниц, и я хочу разделить полный веб-адрес на две части. Скажем, у меня есть адрес http://www.stackoverflow.com/questions/ask . Мне нужен протокол и домен (например, http://www.stackoverflow.com ) и путь (например, / questions / ask). Я решил, что это может быть решено каким-то регулярным выражением, но я не очень удобен в этом. Какие-либо предложения?

3 Solutions collect form web for “Как разбить веб-адрес”

Дэн прав: urlparse – ваш друг:

>>> from urlparse import urlparse >>> >>> parts = urlparse("http://www.stackoverflow.com/questions/ask") >>> parts.scheme + "://" + parts.netloc 'http://www.stackoverflow.com' >>> parts.path '/questions/ask' 

Используйте модуль urlparse Python:

https://docs.python.org/library/urlparse.html

Для хорошо определенной и хорошо пройденной проблемы, как это, не беспокойтесь, написав свой собственный код, не говоря уже о собственных регулярных выражениях. Они вызывают слишком много проблем ;-).

 import re url = "http://stackoverflow.com/questions/ask" protocol, domain = re.match(r"(http://[^/]*)(.*)", url).groups() 
  • Создание URL с Flask и именами уникальных обработчиков
  • Параметры кода де-кодирования
  • os.path.basename работает с URL-адресами, почему?
  • Получите размер изображения, не загрузив его в Python
  • Как передать переменную тегу {% url%} в django?
  • Сохранение URL-адресов во время Spidering
  • Колба: получить текущий маршрут
  • python tornado get request url
  •  
    Interesting Posts for Van-Lav
    Python - лучший язык программирования в мире.