Последовательность элементов в списке, удовлетворяющих условию

Предположим, у меня есть список этого типа:

# 0 1 2 3 4 5 6 7 8 9 10 11 -- list index li=[-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1 ] 

Я хочу найти каждый индекс, для которого значение будет одинаковым для n следующих индексов.

Я могу сделать это (кропотливо) следующим образом:

 def sub_seq(li,n): ans={} for x in set(li): ans[x]=[i for i,e in enumerate(li[:-n+1]) if all(x==y for y in li[i:i+n])] ans={k:v for k,v in ans.items() if v} return ans li=[-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1] for i in (5,4,3,2): print i, sub_seq(li,i) 

Печать:

 5 {1: [5]} 4 {1: [5, 6]} 3 {1: [5, 6, 7]} 2 {1: [5, 6, 7, 8], 2: [2], -1: [0, 10]} 

Есть лучший способ сделать это?

3 Solutions collect form web for “Последовательность элементов в списке, удовлетворяющих условию”

Анализ данных обычно проще, если вы сначала преобразуете его в удобную форму. В этом случае кодирование длины прогона будет хорошей отправной точкой:

 from itertools import groupby, accumulate from collections import defaultdict def sub_seq(li, n): d = defaultdict(list) rle = [(k, len(list(g))) for k, g in groupby(li)] endpoints = accumulate(size for k, size in rle) for end_index, (value, count) in zip(endpoints, rle): for index in range(end_index - count, end_index - n + 1): d[value].append(index) return dict(d) 

Как указывает Раймонд Хеттингер в своем ответе, groupby упрощает проверку последовательных значений. Если вы также перечислите список, вы можете сохранить соответствующие индексы и добавить их в словарь (я использую defaultdict чтобы сделать функцию максимально короткой):

 from itertools import groupby from operator import itemgetter from collections import defaultdict li = [-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1] def sub_seq(li, n): res = defaultdict(list) for k, g in groupby(enumerate(li), itemgetter(1)): l = list(map(itemgetter(0), g)) if n <= len(l): res[k] += l[0:len(l)-n+1] return res for i in (5,4,3,2): print i, sub_seq(li,i) 

Какие принты:

 5 defaultdict(<type 'list'>, {1: [5]}) 4 defaultdict(<type 'list'>, {1: [5, 6]}) 3 defaultdict(<type 'list'>, {1: [5, 6, 7]}) 2 defaultdict(<type 'list'>, {1: [5, 6, 7, 8], 2: [2], -1: [0, 10]}) 

Я лично считаю, что это немного читаемо, строит меньше объектов, и я думаю, что он работает быстрее.

 li=[-1, -1, 2, 2, -1, 1, 1, 1, 1, 1, -1, -1 ] results = [] i = 0 while i < len(li): j = i + 1 while j < len(li) and li[i] == li[j]: j += 1 results.append((i,li[i],ji)) i = j print results #[(0, -1, 2), (2, 2, 2), (4, -1, 1), (5, 1, 5), (10, -1, 2)] 
  • Как разбить список python на куски одинакового размера?
  • Как проверить, пуст ли пул в Python?
  • Pythonic способ проверить, выполняется ли условие для любого элемента списка
  • Python - изменения счетных знаков
  • Сумма из нескольких списков индексов
  • python - читаемый список объектов
  • Переместить все нули в начало списка в Python
  • Наиболее эффективный способ удаления дубликатов из списка Python при сохранении порядка и удалении самого старого элемента
  •  
    Interesting Posts for Van-Lav

    API Python Facebook – разбиение на страницы курсора

    Лучше, чем eval () при переводе аргументов ключевого слова в QuerySets (Python / Django)

    Наиболее эффективный способ одновременного присвоения значения нулю нескольким переменным

    Потребление памяти продукта itertools Python

    При вызове скрипта Python в чем разница между «./script.py» и «python script.py»

    В чем разница между запуском скрипта из командной строки и exec () с PHP?

    Самый быстрый способ генерации 1 000 000 + случайных чисел в python

    В Python эффективно определить, сдвинуты ли два списка друг друга

    Создание dataframe из словаря, где записи имеют разную длину

    Python: найдите подстроку в строке и верните индекс подстроки

    TFIDF вычисляет путаницу

    Получить код завершения процессов, запущенных с помощью многопроцессорной обработки. Pool.map

    Mayavi Mlab: рисование октаэдров

    Как эти строки представлены внутри интерпретатора Python? Я не понимаю

    Удалять нецифровые значения из серии

    Python - лучший язык программирования в мире.