Tag: строка

Поиск повторяющейся подстроки в большой строке

Возьмем, например, следующие строки 0.714285714285714285714285714285714285714285 0.111111111111111111111111111111111111111111 0.166666666666666666666666666666666666666666 Я хочу найти подстроку, повторяющую повторение для каждого. 714285 1 6 Как я могу это сделать в python. Использование regex в порядке, я попробовал следующее: import re testString = "0.714285714285714285714285714285714285714285" print(re.search(r"(.+)\1", testString).group(1)) Это дает мне (неправильный) вывод: 714285714285714285 Это должно быть 7814285 Как это исправить? Есть ли способ […]

Как лучше хранить большие последовательности текста в Python?

Недавно я обнаружил, что мой ученик делает независимый проект, в котором он использовал очень большие строки (2-4 МБ) в качестве значений в словаре. У меня никогда не было причин работать с такими большими блоками текста, и мне стало интересно, есть ли проблемы с производительностью, связанные с созданием таких больших строк. Есть ли лучший способ сделать […]

Python генерирует url для строки

(Название может измениться не слишком уверенно, как его назвать) Поэтому я пытаюсь открыть URL-адрес, который направляется на случайную страницу (этот URL-адрес: http://anidb.net/perl-bin/animedb.pl?show=anime&do.random=1 ), и я хочу вернуться туда, где это URL идет randomURL = urllib.urlopen("http://anidb.net/perl-bin/animedb.pl?show=anime&do.random=1") print(randomURL) Вот что я (глупо) думал бы работать. Я импортировал urllib

Как разбить строку на строку, за исключением случаев, когда строка находится в кавычках в python?

Я хотел бы разбить следующую строку словом «и», за исключением случаев, когда слово «и» находится в кавычках string = "section_category_name = 'computer and equipment expense' and date >= 2015-01-01 and date <= 2015-03-31" Желаемый результат ["section_category_name = 'computer and equipment expense'","date >= 2015-01-01","date <= 2015-03-31"] Кажется, я не могу найти правильный шаблон регулярного выражения, который […]

Мой скрипт Python добавляет лишние символы в мою строку

Я пытаюсь отформатировать путь к файлу внутри строки, но он продолжает добавлять дополнительные «\». template = "{%% extends 'base.html' %%}"\ "{%% block content %%}"\ " "\ "<h1>%s</h2>"\ " "\ "<p>%s</p> "\ "<p><img src= '%s'></p>"\ "{%% endblock %%}" %(title, text, img_path) он возвращает это. <p><img src= \'myDirectory/scarlett Johanson/1448556501.89.jpg\'></p>{% endblock %}'} Я не хочу \ перед строкой […]

Строка не может вставить новый iPython 5.0

В консоли python 2.7, а также в iPython 4, я смог вставить эту строку в переменную следующим образом: In [2]: c = 'ÙjÌÉñõµ Ï“JÖq´ž# »&•¼ ²nËòQZ<_' Впоследствии я мог бы ввести: In [3]: print(c) и он вернет ÙjÌÉñõµ Ï“JÖq´ž# »&•¼ ²nËòQZ<_ Однако в iPython 5.0 появляется следующая ошибка: In [4]: c = 'ÙjÌÉñõµ^LÏ“JÖq´ž#»&•¼²nËòQZ<_' File "<ipython-input-4-9bf9f2fa5210>", […]

Найти количество разрывов в последовательности

У меня есть программа, которая анализирует последовательности аллелей. Я пытаюсь написать код, который определяет, завершен ли аллель или нет. Для этого мне нужно подсчитать количество разрывов в контрольной последовательности. Разрыв обозначается строкой '-'. Если есть более одного разрыва, я хочу, чтобы программа говорила «Неполная аллеля». Как я могу вычислить, как подсчитать количество разрывов в последовательности? […]

Возвращаемая строка, которая не является подстрокой других строк – возможно ли это во времени меньше O (n ^ 2)?

Вам задан массив строк. вам нужно вернуть только те строки, которые не являются подстроками других строк в массиве. Вход – ['abc','abcd','ab','def','efgd'] . Вывод должен быть – 'abcd' и 'efgd' Я придумал решение в python с временной сложностью O (n ^ 2). Есть ли возможное решение, которое дает меньшую временную сложность? Мое решение: def sub(l,s): l1=l […]

Python: удалить все символы перед первой буквой в строке

После тщательного поиска я смог найти, как удалить все символы перед конкретным письмом, но не до буквы. Я пытаюсь превратить строку из этого: " This is a sentence. #contains symbol and whitespace К этому: This is a sentence. #No symbols or whitespace Я пробовал следующий код, но строки, такие как первый пример, все еще появляются. […]

Использовать латинские символы в appengine

Как хранить латинские символы в appengine? (например, «peña»), когда я хочу сохранить это, я получаю эту ошибку: UnicodeDecodeError: 'ascii' codec can't decode byte 0xf1 in position 2: ordinal not in range(128) Я могу изменить С на N, но нет ли другого и лучшего пути? И если я кодирую значение, как можно снова напечатать «Пенья»?

Python - лучший язык программирования в мире.