Как указать входной файл для бегуна из Python?

Я пишу внешний скрипт для запуска задания mapreduce через модуль Python mrjob на своем ноутбуке (а не на Amazon Elastic Compute Cloud или любом большом кластере).

Я прочитал из документации mrjob, что я должен использовать MRJob.make_runner() для запуска задания mapreduce из отдельного сценария python следующим образом.

 mr_job = MRYourJob(args=['-r', 'emr']) with mr_job.make_runner() as runner: ... 

Однако как указать, какой входной файл использовать? Я хочу использовать файл «datalines.txt» в том же каталоге, что и мой скрипт mapreduce и другой скрипт python, который запускает карту. Кроме того, как я могу указать результат?

Я не мог найти функцию в документации mrjob, которая позволяет мне указывать эти параметры.

One Solution collect form web for “Как указать входной файл для бегуна из Python?”

Руководство по началу работы предполагает, что ввод считывается из stdin или файлов, поставляемых в командной строке:

 mr_job = MRYourJob(args=["datalines.txt"]) 
Python - лучший язык программирования в мире.