python_google_translator谷歌翻譯Python接口
谷歌翻譯Python接口
本庫未使用谷歌翻譯API,而是直接通過谷歌翻譯Web接口抓取數(shù)據(jù)。
為什么要做本庫?
谷歌官方提供的翻譯API價(jià)格太貴,大約是20刀/MB,用不起?。。。?br>本庫直接通過谷歌翻譯的Web接口進(jìn)行數(shù)據(jù)抓取,不會(huì)產(chǎn)生任何費(fèi)用。
本庫的優(yōu)勢:省錢,不會(huì)產(chǎn)生任何費(fèi)用!
存在的問題和解決方法:
由于谷歌反采集做的很嚴(yán)格,如果同一IP訪問頻率過高,查詢請求就可能被攔截,甚至在一段時(shí)間內(nèi)IP被加入黑名單。
本庫支持代理,可以通過指定代理進(jìn)行輪換IP查詢,降低被攔截的風(fēng)險(xiǎn)。
用法舉例:
>>> from python_google_translator import translator
>>> print translator.translate(sl='en', tl='zh-CN', content='Hi,\nWhat time is it?', proxy='qi:[email protected]:8080')
您好!
現(xiàn)在是什么時(shí)候?
參數(shù)說明:
sl - 原語言。
tl - 翻譯成的目標(biāo)語言。
content - 要翻譯的內(nèi)容。
proxy - 訪問谷歌翻譯使用的代理。
語言標(biāo)識(shí)符(RFC 3066): http://www.i18nguy.com/unicode/language-identifiers.html 關(guān)于我們:
鯤鵬數(shù)據(jù)(西安鯤之鵬網(wǎng)絡(luò)信息技術(shù)有限公司)從2010年開始專注于Web數(shù)據(jù)抓取領(lǐng)域。致力于為廣大中國客戶提供準(zhǔn)確、快捷的Web數(shù)據(jù)采集相關(guān)服務(wù)。
您只需告訴我們您所要搜索的數(shù)據(jù)是什么,您要取得的是什么,你想要的數(shù)據(jù)是哪種格式,我們將為您做所有的工作,并直接把最終數(shù)據(jù)提交給你。數(shù)據(jù)的格式可以是CSV、JSON、XML、ACCESS、MSSQL、MYSQL等。
