日韩精品在线观看一区二区,强奸一区二区三区,亚州色图在线观看,三上悠亚全部作品无删减,亚洲乱伦一区,美女被人c,免费涩涩视频,美女视频黄a是视频大全国产

點(diǎn)擊關(guān)注上方“SQL數(shù)據(jù)庫開發(fā)”，

設(shè)為“置頂或星標(biāo)”，第一時(shí)間送達(dá)干貨

大家好，又到了Python辦公自動(dòng)化專題。

今天講的是各位一定會(huì)接觸到的PDF轉(zhuǎn)換，關(guān)于各種格式的文件轉(zhuǎn)換為PDF有很多第三方工具與網(wǎng)站可以實(shí)現(xiàn)，但是使用Python的好處不僅可以批量轉(zhuǎn)換，同時(shí)一旦腳本寫完了以后就可以一鍵執(zhí)行，徹底解放雙手，那么本文就來盤一盤如何使用Python來將Word/Excel/PPT/Markdown/Html等各種格式的文件轉(zhuǎn)換為PDF！

Word轉(zhuǎn)PDF

Word轉(zhuǎn)PDF應(yīng)該是最常見的需求了，畢竟使用PDF格式可以更方便展示文檔，雖然在Word中可以直接導(dǎo)出為PDF格式，但是使用Python可以批量轉(zhuǎn)換，更加高效。

目前在Python中針對Word轉(zhuǎn)換為PDF的庫有很多，比如win32就可以調(diào)用word底層vba，將word轉(zhuǎn)成pdf，或者comtypes等，但是這些常用的庫僅能在Windows機(jī)器上運(yùn)行，所以為了照顧mac用戶本文使用一個(gè)比較小眾的庫docx2pdf，看名字就能知道這是專門用于word轉(zhuǎn)pdf，安裝很簡單

pip?install?docx2pdf

使用也比win32等庫更簡潔，一行代碼導(dǎo)入一行代碼轉(zhuǎn)換即可

from?docx2pdf?import?convert
convert("input.docx",?"output.pdf")

但是有人就會(huì)說雖然簡單，但是這個(gè)操作word本身就可以完成，好的接下來放大招，我們可以使用下面的代碼找到當(dāng)前或者指定文件夾下的全部word文件

#查找當(dāng)前目錄下的全部word文件
import?os
import?glob
from?pathlib?import?Path

path?=?os.getcwd()?+?'/'
p?=?Path(path)?#初始化構(gòu)造Path對象
FileList=list(p.glob("**/*.docx"))?

接下來只要寫一個(gè)循環(huán)就可以將該目錄下的全部word一次性轉(zhuǎn)換為PDF

for?file?in?FileList:
????convert(file,f"{file}.pdf")

就這樣，不到10行代碼，只要一秒，指定文件夾中5份Word就輕松轉(zhuǎn)換為PDF，現(xiàn)在還能使用我們之前自動(dòng)化系列文章寫過的批量合并PDF結(jié)合一鍵合并這5份PDF！

Excel轉(zhuǎn)PDF

Excel轉(zhuǎn)PDF可能平時(shí)用的不多，但是作為Office全家桶中的重要工具，并且轉(zhuǎn)換完的表格可以復(fù)制所以我們也講一下。使用到的工具既不是常用的openpyxl也不是pandas，而是另一個(gè)專門用于處理PDF的庫fpdf

import?pandas?as?pd
import?numpy?as?np
df_1?=?pd.DataFrame(np.random.randn(10,?2),?columns=list('AB'))

為了方便講解我們使用Pandas和NumPy來創(chuàng)建一個(gè)示例數(shù)據(jù)文件，當(dāng)然也可以使用從本地讀取

現(xiàn)在可以使用下面的代碼將這個(gè)表格轉(zhuǎn)換為PDF

from?fpdf?import?FPDF
pdf?=?FPDF()
pdf.add_page()
pdf.set_xy(0,?0)
pdf.set_font('arial',?'B',?14)
pdf.cell(60)
pdf.cell(70,?10,?'Excel?to?PDF',?0,?2,?'C')
pdf.cell(-40)
pdf.cell(50,?10,?'Index?Column',?1,?0,?'C')
pdf.cell(40,?10,?'A',?1,?0,?'C')
pdf.cell(40,?10,?'B',?1,?2,?'C')
pdf.cell(-90)
pdf.set_font('arial',?'',?12)
for?i?in?range(0,?len(df_1)):
????col_ind?=?str(i)
????col_a?=?str(df_1.A.iloc[i])
????col_b?=?str(df_1.B.iloc[i])
????pdf.cell(50,?10,?'%s'?%?(col_ind),?1,?0,?'C')
????pdf.cell(40,?10,?'%s'?%?(col_a),?0,?0,?'C')
????pdf.cell(40,?10,?'%s'?%?(col_b),?0,?2,?'C')
????pdf.cell(-90)
pdf.output('Excel2PDF.pdf',?'F')

，其實(shí)思路和openpyxl類似，遍歷每一個(gè)單元格并寫入數(shù)據(jù)，只不過現(xiàn)在是往PDF文件中寫入。

PPT轉(zhuǎn)PDF

本節(jié)介紹一下PPT如何轉(zhuǎn)換為PDF，但是我搜了一大圈都沒有MAC用戶可以實(shí)現(xiàn)的方法，所以只能針對Windows去操作，使用到的就是在word2pdf中講到的comtypes

import?sys
import?os
import?comtypes.client
#設(shè)置路徑
input_file_path?=?sys.argv[1]
output_file_path?=?sys.argv[2]
input_file_path?=?os.path.abspath(input_file_path)
output_file_path?=?os.path.abspath(output_file_path)
#創(chuàng)建PDF
powerpoint?=?comtypes.client.CreateObject("Powerpoint.Application")
powerpoint.Visible?=?1
slides?=?powerpoint.Presentations.Open(input_file_path)
#保存PDF
slides.SaveAs(output_file_path,?32)
slides.Close()

相關(guān)參數(shù)與細(xì)節(jié)可以查閱comtypes官方文檔，因?yàn)槲沂莔ac所以沒有過多研究，在成功轉(zhuǎn)換之后就可以和我們之前的批量操作與合并進(jìn)行結(jié)合實(shí)現(xiàn)自動(dòng)化了！

md轉(zhuǎn)pdf

關(guān)于markdown轉(zhuǎn)pdf，幾乎所有markdown編輯器都支持導(dǎo)出為pdf格式，本以為這個(gè)需求并不高，但是研究了一圈發(fā)現(xiàn)很多老外造了很多md轉(zhuǎn)pdf的輪子，比如md2pdf、markdown2pdf、md2pdf-client等。因?yàn)榇蠖鄶?shù)博客使用的是markdown格式，使用這些庫可以很好的將博客文章批量轉(zhuǎn)換為PDF文檔存儲(chǔ)。

早起都試了一圈，找到一個(gè)語法最簡單的markdown2pdf3，直接pip安裝即可，使用兩行代碼即可將一個(gè)md文件轉(zhuǎn)換為pdf

from?markdown2pdf3?import?*
convert_markdown_to_pdf('test.md')?#你的markdown文件路徑

但是要注意的是如果有中文，還需要進(jìn)行一些額外的設(shè)置，可以查閱官方文檔，不過現(xiàn)在就能和之前講的Word轉(zhuǎn)PDF結(jié)合，批量轉(zhuǎn)換指定路徑下的全部markdown文件為pdf，比如可以使用下面的代碼找到當(dāng)前文件夾下的全部md文件

import?os
import?glob
from?pathlib?import?Path

path?=?os.getcwd()?+?'/'
p?=?Path(path)?#初始化構(gòu)造Path對象
FileList=list(p.glob("**/*.md"))?

html轉(zhuǎn)pdf

關(guān)于html也就是網(wǎng)頁轉(zhuǎn)為PDF是來問我最多的問題，其實(shí)很簡單，之前在Selenium爬取公眾號全部文章這篇文章中就提到使用PDFKIT即可，但是并不是直接pip安裝pdfkit就行，我們需要提前進(jìn)入下面的網(wǎng)站選擇自己電腦系統(tǒng)對應(yīng)的wkhtmltopdf下載安裝

https://wkhtmltopdf.org/downloads.html

安裝完使用pip安裝pdfkit

pip?install?pdfkit

現(xiàn)在我們就能使用兩行代碼轉(zhuǎn)換指定網(wǎng)頁為PDF格式，比如將我的第一篇自動(dòng)化文章轉(zhuǎn)為PDF

看起來效果還是非常好的，所有格式包括代碼都完整的保存了下來，接下來怎么做就不用我多說了，比如你想下載一個(gè)公眾號所有文章為PDF格式，那就先將歷史文章URL提取出來，接著使用pdfkit轉(zhuǎn)換即可，而這兩步驟我們都已經(jīng)詳細(xì)講解過了！

——End——
后臺回復(fù)關(guān)鍵字：1024，獲取一份精心整理的技術(shù)干貨
后臺回復(fù)關(guān)鍵字：進(jìn)群，帶你進(jìn)入高手如云的交流群。
推薦閱讀
50 款數(shù)據(jù)可視化分析工具大集合，總有一款適合你
推薦一款Excel快速加載SQL的插件，方便又好用
為Navicat正名，Navicat完全使用手冊（上）
《SQL必知必會(huì)》讀書筆記，30分鐘入門SQL！
像Excel一樣使用SQL進(jìn)行數(shù)據(jù)分析

這是一個(gè)能學(xué)到技術(shù)的公眾號，歡迎關(guān)注
點(diǎn)擊「閱讀原文」了解SQL訓(xùn)練營

使用Python轉(zhuǎn)換PDF，Word/Excel/PPT/md/HTML都能轉(zhuǎn)！

Word轉(zhuǎn)PDF

Excel轉(zhuǎn)PDF

PPT轉(zhuǎn)PDF

md轉(zhuǎn)pdf

html轉(zhuǎn)pdf

使用Python轉(zhuǎn)換PDF，Word/Excel/PPT/md/HTML都能轉(zhuǎn)！