python pdf转txt乱码

在 Python 中，可以使用 PyPDF2 库来读取 PDF 文件，然后使用 codecs 库来解码文本。下面是一个例子：

import codecs
import PyPDF2
with open('input.pdf', 'rb') as f:
    pdf = PyPDF2.PdfFileReader(f)
    n_pages = pdf.getNumPages()
    for i in range(n_pages):
        page = pdf.getPage(i)
        text = page.extractText()
        text = text.encode('utf-8')
        with codecs.open('output.txt', 'a', encoding='utf-8') as f:
            f.write(text)
在这个例子中，我们打开了一个 PDF 文件，然后循环遍历每一页。对于每一页，我们使用 extractText 方法提取文本，然后将其编码为 UTF-8。最后，我们打开一个文本文件，并使用 UTF-8 编码将文本写入文件中。


    
     
      
       
        
        
         
          
           
            
            
            
             
              
              hantmac
        Python
             
            
           
           
            
             
              
              
              
              
               将你的小册制作成一整本PDF
              
             
             
              
               
                之前写过一个Golang的版本，但是阅读效果不是特别好，这个Python版本可以将所有章节制作成单个PDF文件。看起来会更加方便，转mobi格式的正在开发，遇到一点小问题，使用的kindle_maker库报错。如果想要在kindle上观看小册，可以使用这个工具将PDF转为mob…
               
              
             
             
              
               
               
                2913
               
              
              
               
                
               
               
                程序员晚枫
        Python
               
              
             
            
           
           
            
             
              
              
              
              
               5个实用的PDF自动化办公操作~1行Python代码搞定：解密、加水印、PPT/Word/TxT转PDF
              
             
             
              
               
                python-office持续更新中。 今天给的大家分享：5个PDF相关的操作，都是一行代码可以实现~ 这些操作，并非是炫技，而是真的实用！
               
              
             
             
              
               
               
                146
               
              
              
               
                
               
               
                Python学习圈
        Python
               
              
             
            
           
           
            
             
              
              
              
              
               1行Python代码搞定：解密、加水印、PPT/Word/TxT转PDF
              
             
             
              
               
                PDF加密、解密 我们在日常生活中经常看到加密文档，当我们想保护重要文档时，也需要给自己的文档进行加密。 安装 代码 有加密就有解密。 代码 PPT转PDF PPT文件，批量转成PDF，了解一下？ 安
               
              
             
             
              
               
               
                154
               
              
              
               
                
               
               
                Cassie1492949236626
        Python
        MySQL
               
              
             
            
           
           
            
             
              
              
              
              
               Linux 上将 txt 导入 mysql
              
             
             
              
               
                昨天写小项目的时候遇到了一个需求：把txt文档的数据导入到mysql数据库中，开始本来想直接用Mysql Workbench导入TXT文件，但是最后发现不支持TXT导入，结果我吧嗒吧嗒的去把TXT转了Excel，拿到Linux上导入的时候又发现了各种乱码问题。 抱着没有什么是程…
               
              
             
             
              
               
               
                1718
               
              
              
               
                
               




    

               
                Python
        GitHub
               
              
             
            
           
           
            
             
              
              
              
              
               python 实用程序  | PDF 转 Word
              
             
             
              
               
                阅读文本大概需要 6 分钟。 现在网上有很多文档是 pdf 格式，虽然这个格式阅读起来很方便，并且里面的内容不会乱掉，但相应的我们就无法修改里面的内容。虽然现在市面上有很多 pdf 转 word 软件，比如 wps，但大多数的软件是要收费的，并且价格不菲。 前些天就有人叫我帮她…
               
              
             
             
              
               
               
                1230
               
              
              
               
                
               
               
                ProgrammerRan
        Python
               
              
             
            
           
           
            
             
              
              
              
              
               60 行 Python代码将 PDF 文档转换为 Word 文档
              
             
             
              
               
                相信 PDF 文档转 Word 文档在您工作中是非常常见的一个问题，往往都找不到有效的解决办法，可以使用很多工具软件转换，但是大多都需要收费，还不能保证转换后格式、内容的完整性。不愿付费的你，今天教你怎样用64 行 Python 代码实现 PDF 文档转换成 Word 文档。 …
               
              
             
             
              
               
               
                3064
               
              
              
               
                
               
               
                windSeS
               
              
             
            
           
           
            
             
              
              
              
              
               word转PDF后mathtype公式乱码以及图片分辨率降低等一系列问题|完美解决
              
             
             
              
               
                word转PDF后mathtype公式乱码以及图片分辨率降低等一系列问题|完美解决 问题描述 最近在投一篇期刊论文，直接提交word文档，当时没有查看提交预览，一审审稿意见全是：公式乱码、公式乱码、乱
               
              
             
             
              
               
               
                588
               
              
              
               
                
               
               
                _Sun47118
               
              
             
            
           
           
            
             
              
              
              
              
               个人整合，java 通过aspose转PDF ，支持各种格式  JPG ，TXT， PPT， EXCEL， DOC    免费开箱即用版
              
             
             
              
               
                1. 导入jar包
               
              
             
             
              
               
               
                3534
               
              
              
               
                
               
               
                lcb8816
        Python
               
              
             
            
           
           
            
             
              
              
              
              
               python json转excel
              
             
             
              
               
                json2excel,dataframe，使用最简便.json2excel,dataframe，使用最简便
               
              
             
             
              
               
               
                1667
               
              
              
               
                
               
               
                Joker_cc
        Python
               
              
             
            
           
           
            
             
              
              
              
              
               python3 生成table转图片
              
             
             
              
               
                准备： python3 pip3 install imgkt html_table 下载安装wkhtmltoimg：https://wkhtmltopdf.org/downloads.html 然后就
               
              
             
             
              
               
               
                256