TypeError: необходим байтовый объект, а не «str» в pdfminer.six – Python 3.5

Я пытаюсь извлечь содержимое pdf, используя pdfminer.six в Python 3.5 в формате html.

Получение следующей ошибки –

Traceback (most recent call last): File "C:\Data\python\pdftotext\pdftohtml.py", line 30, in <module> alltext = convert_pdf_to_html('C:/Data/python/pdftotext/sample.pdf') File "C:\Data\python\pdftotext\pdftohtml.py", line 23, in convert_pdf_to_html interpreter.process_page(page) File "C:\Users\Rohan\AppData\Local\Programs\Python\Python35\lib\site-packages\pdfminer\pdfinterp.py", line 836, in process_page self.render_contents(page.resources, page.contents, ctm=ctm) File "C:\Users\Rohan\AppData\Local\Programs\Python\Python35\lib\site-packages\pdfminer\pdfinterp.py", line 848, in render_contents self.execute(list_value(streams)) File "C:\Users\Rohan\AppData\Local\Programs\Python\Python35\lib\site-packages\pdfminer\pdfinterp.py", line 864, in execute method = 'do_%s' % name.replace('*', '_a').replace('"', '_w').replace("'", '_q') TypeError: a bytes-like object is required, not 'str' 

Я пытаюсь создать код путем преобразования из кода, который первоначально использовал pdfminer и python 2.6, чтобы он мог работать в 3.5

 from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.converter import HTMLConverter from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from pdfminer.pdfpage import PDFPage from six import BytesIO as StringIO import re import csv def convert_pdf_to_html(path): rcmgr = PDFResourceManager() retstr = StringIO() codec = 'utf-8' laparams = LAParams() device = HTMLConverter(rcmgr,retstr,codec=codec,laparams=laparams) fp = open(path,'rb') interpreter = PDFPageInterpreter(rcmgr,device) password = "" maxpages = 0 caching = True pagenos = set() for page in PDFPage.get_pages(fp,pagenos,maxpages= maxpages,password=password,caching=caching,check_extractable=True): interpreter.process_page(page) fp.close() device.close() str=retstr.getvalue() retstr.close() return str gettext = convert_pdf_to_html('C:/Data/python/pdftotext/sample.pdf') 

Как исправить код, чтобы он мог запускаться в Python 3.5?

Благодаря!

 
Interesting Posts for Van-Lav
Python - лучший язык программирования в мире.