1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        用 Python 開發(fā)了一個 PDF 抽取表格的小工具

        共 468字,需瀏覽 1分鐘

         ·

        2022-06-25 09:40


        ↑ 關(guān)注 + 星標(biāo) ,每天學(xué)Python新技能

        后臺回復(fù)【大禮包】送你Python自學(xué)大禮包

        從 PDF 里 copy 表格時,粘貼出來后格式都是錯亂的。這麻煩事交給 Python 再合適不過,所以,我開發(fā)了一個從 PDF 抽取表格另存為 Excel 文件的應(yīng)用,已把它部署到 huggingface ,同學(xué)可以直接去感受一下:

        https://huggingface.co/spaces/beihai/PDF-Table-Extractor

        使用方法

        準(zhǔn)備一個PDF(暫不支持掃描版)


        頁面中上傳PDF,也不支持200M以上的文件,如果太大,大家可以先去壓縮一下,我記得adobe官網(wǎng)有就類似小工具。


        上傳完成后,選擇表格所在PDF的頁碼,等待片刻就會出現(xiàn)“提取完成,點(diǎn)擊下載”


        下載Excel,格式還需要微調(diào),不過比直接復(fù)制出來的要好很多了,能節(jié)省一些時間。


        目前這個工具還在完善,比如直接抽取PDF中所有表格,敬請期待。



        1. PyCharm是真的強(qiáng)?。?!

        2. 神器 jupyter,終于來了!


        瀏覽 27
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            妓啪啪集百万部激情无码 | 国产大鸡巴 | 久久国产色综合久久88女性内衣 | 狠狠色色 | 嗯~啊~轻一点视频在线观看 | 日本二区三区精品免费 | 91短视频在线 | 久久人人爽人人爽人人 | 亚洲无码在线精品 | 亚洲成人综合网站 |