Слияние двух текстовых файлов с разделителями табуляции одним общим столбцом в python

@ tim-pietzcker Я хотел бы объединить два текстовых файла с разделителями табуляции, которые разделяют один общий столбец. У меня есть «файл идентификатора», который выглядит так (2 столбца на 1050 строк):

геном 1 модуля 1
ген 1 модуля 2
..
модуль x gene y

У меня также есть текстовый файл с таргетингом на табуляции, который выглядит так (36 столбцов на 12000 строк):

ген 1 образец 1 образец 2 и т. д.
образец 2 гена 2 образца 2 и т. д.
..
ген z образец 1 образец 2 и т. д.

Я хотел бы объединить два файла на основе идентификатора гена и иметь как соответствующие значения выражений, так и принадлежность модуля из идентификатора и целевых файлов. Чтобы взять гены из файла идентификатора, найдите их в целевом файле и создайте новый файл с номером модуля #, gene # и выражениями в одном файле. Ваши предложения будут приветствоваться.

Благодаря!

One Solution collect form web for “Слияние двух текстовых файлов с разделителями табуляции одним общим столбцом в python”

Откройте файл описания гена и загрузите словарь, где ключ будет номером гена, а значение будет описанием образца.

Затем откройте файл модуля и зациклируйте его строки. Для каждой строки найдите соответствующую запись в словаре. Распечатайте модуль, ген, описание образца.

Это оно! Если вам нужна дополнительная информация, проверьте, как читать файл и использовать словарь в документации на python.

  • Класс Python для объединения отсортированных файлов, как это можно улучшить?
  • Объединение столбцов нескольких файлов в один файл - Python
  •  
    Interesting Posts for Van-Lav

    Как избежать проверки орфографии на строке в Pycharm

    Получить вкладку IPython для ipdb

    Установка TensorFlow в Windows (Python 3.6.x)

    AttributeError: модуль 'tensorflow.models.embedding.gen_word2vec' не имеет атрибута 'skipgram_word2vec'

    получение результатов dis.dis

    Какие учетные данные я должен использовать для BulkLoader для Google App Engine на сервере разработки?

    Заказ и разбивка на страницы в SQL-алхимии с использованием не-sql-ранжирования

    Как очистить подпроцесс. Открытие экземпляров после завершения процесса

    Как рассортировать дистрибутив scipy.stats (не может сортировать объекты instancemethod)

    Установка данных nltk в скрипт setup.py

    Использование Gensim показывает «Используется медленная версия gensim.models.doc2vec»

    Могу ли я использовать селен с помощью Scrapy без фактического открытия браузера с помощью python

    SystemError: родительский модуль '' не загружен, не может выполнять относительный импорт

    Оператор Python if с использованием данных CSV

    Cmake не может найти библиотеки Python

    Python - лучший язык программирования в мире.