Tag: grep

Рекурсивное значение ключа в файле

Существует файл, имеющий два столбца [можно понимать как ключ и значение]: k1 v1 k2 v2 k3 v3 k4 k1 k5 k4 Теперь я хочу, чтобы выход из этого файла: k1 v1 k2 v2 k3 v3 k4 k1 v1 k5 k4 k1 v1 Ибо, если значение другого ключа – это еще один ключ, тогда поднесите это […]

Команда grep, вызываемая из python

Платформа: Windows Grep: http://gnuwin32.sourceforge.net/packages/grep.htm Python: 2.7.2 Командная строка Windows, используемая для выполнения команд. Я ищу для следующего шаблона "2345$" в файле. Содержимое файла выглядит следующим образом: abcd 2345 2345 abcd 2345$ grep "2345$" file.txt grep возвращает 2 строки (первый и второй) успешно. Когда я пытаюсь выполнить указанную выше команду через python, я не вижу никакого […]

Ошибка после системного вызова zgrep из python только для больших файлов

Я использую скрипт python, чтобы сделать системный вызов zgrep и распечатать только первый результат с помощью параметра -m1 . Автор сценария: #! /usr/bin/env python2.7 import subprocess print subprocess.check_output("zgrep -m1 'a' test.txt.gz", shell=True) Ошибка: При запуске скрипта на больших файлах (+ 2 МБ) генерируется следующая ошибка. > ./broken-zgrep.py gzip: stdout: Broken pipe Traceback (most recent call […]

Использование grep в python

Существует файл (query.txt), в котором есть несколько ключевых слов / фраз, которые должны быть сопоставлены с другими файлами с помощью grep. Последние три строки следующего кода работают отлично, но когда одна и та же команда используется внутри цикла while, она переходит в бесконечный цикл или что-то (т.е. не отвечает). import os f=open('query.txt','r') b=f.readline() while b: […]

Пересечение текстовых файлов

Как я могу вычислить пересечение двух текстовых файлов с точки зрения исходного текста? Не имеет значения, использует ли решение команду оболочки или выражается в Python, Elisp или других распространенных языках сценариев. Я знаю comm и grep -Fxv -f file1 file2 . Оба предполагают, что меня интересует пересечение линий , в то время как меня интересует […]

обрабатывать текстовый файл с использованием различных разделителей

Мой текстовый файл (к сожалению) выглядит так … <amar>[amar-1000#Fem$$$_Y](1){india|1000#Fem$$$,mumbai|1000#Mas$$$} <akbar>[akbar-1000#Fem$$$_Y](1){} <john>[-0000#$$$_N](0){USA|0100#$avi$$,NJ|0100#$avi$$} Он содержит имя клиента, за которым следует некоторая информация. Последовательность … текстовая строка, за которой следует список, набор и затем словарь <> [] () {} Это не совместимый с python файл, поэтому данные не так ожидаются. Я хочу обработать файл и извлечь некоторую информацию. […]

grep -r в python

я хотел бы реализовать команду unix 'grep -r' в функции python. Я знаю о command.getstatusoutput (), но пока я не хочу использовать это. я придумал это: def grep_r (str, dir): files = [ o[0]+"/"+f for o in os.walk(dir) for f in o[2] if os.path.isfile(o[0]+"/"+f) ] return [ l for f in files for l in […]

Есть ли способ вывода строк по очереди из исполняемой в настоящее время программы python?

Когда трубопровод печатает выходные данные из сценария python с командой grep, вывод из сценария, по-видимому, передается только в следующую команду после завершения всего скрипта. Например, в скрипте test_grep.py например, следующее: #!/usr/bin/env python from time import sleep print "message1" sleep(5) print "message2" sleep(5) print "message3" при вызове с ./test_grep.py | grep message ./test_grep.py | grep message […]

Подпроцесс Python Grep

Я пытаюсь использовать команду grep в скрипте python, используя модуль подпроцесса. Вот что я имею: userid = 'foo12' p = subprocess.Popen(['grep', "%s *.log"%userid], stdout=subprocess.PIPE) И он ничего не возвращает. Я не совсем уверен, что я делаю неправильно, поэтому кто-то может объяснить. Текущий метод, который я использую для этого, заключается в добавлении shell = true, который […]

Python: UnicodeEncodeError, когда я использую grep

Я использую простой скрипт python для получения результатов резервирования для моего CID: simple.py : data = {"minorRev":"current minorRev #","cid":"xxx","apiKey":"xxx","customerIpAddress":" ","creationDateStart":"03/31/2013","} url = 'http://someservice/services/rs/' req = requests.get(url,params=data) print req print req.text print req.status_code Теперь в командной строке, если я делаю python simple.py он отлично работает и печатает переменную req.text Однако, когда я пытаюсь сделать python simple.py […]

Python - лучший язык программирования в мире.