本文介绍一下如何通过python免费使用谷歌翻译。
前面两篇文章中使用了google 付费的API有如下两个问题:
1.费用在100万字符20美元,资费还是比较昂贵的。如果经常翻译的话,花费较大。
2.速度比较慢。猜测原因可能是google为了提供较好的翻译服务,后台使用了神经网络等机器学习的方法,对于有的不通顺的句子响应非常的慢。
由于我们在translate.google.com的页面翻译是免费的,那么则是可以通过模拟浏览器的的调用来实现免费的。鉴于此,在github上寻找到了一个可以免费翻译的项目。原来的项目提示时在python3.4+下使用,我在python2.7下面验证也是可以使用的,如果想直接在python2.7下使用,也可以之直接访问我的github,这里,我将源项目fork过来,根据自己的实践做了修改,主要解决HTTP的异常响应处理,使其能够批量的翻译而不会导致程序中断。
如果想要运行该项目,建议使用源码安装,首先代码较为简单,其次可以按照自己的方式修改。操作如下:
1.git clone https://github.com/IAMABOY/GoogleFreeTrans.git
2.需要安装几个软件包,如下pip install pytest;pip install flake8;pip install coverage;pip install PyExecJS
3.有几个地方编码问题,文件 GoogleFreeTrans/CalcTk.py
以及tests/test_all.py
开头加上# encoding: utf-8
,我已经添加完毕,不需要在额外的添加
4.运行python setup.py test
后可能提示tests/test_all.py::test_unicode FAILED
,主要是test中的韩文,改成英文即可, 对于后续翻译没有影响,可以忽略
5.运行python setup.py install
完成安装
6.完成安装后就可以运行如下的测试脚本
from GoogleFreeTrans import Translator
if __name__ == '__main__':
translator = Translator.translator(src='en', dest='fr')
print(translator.translate('china'))
可以得到正常的翻译结果。
当然该项目主要的执行逻辑在GoogleFreeTrans/Translator.py
下面,即用代码模拟浏览器向谷歌翻译服务器https://translate.google.cn/translate_a/single
发起的GET 请求,解析返回的结果,因此是免费的。
GET请求中很多的参数是固定的,但是google为了防止爬虫,其中的参数tk(ticket)会根据请求内容的不同发生变化。Tk的值是根据文本内容以及TKK 算出来的,TKK 是根据 translate.google.cn 这个网页源代码中有一段js代码算出来的。当然这些复杂的操作已经有现成的实现,对应的就是GoogleFreeTrans/CalcTk.py
,GoogleFreeTrans/gettkk.py
中的代码。如果想了解背后的原理,建议使用chrome F12分析一次翻译请求即可。
在该项目的基础上,就可以批量的获取google 翻译提供的服务,且免费。目前24h能够解析大概15000次请求,单一的IP Google并没block的动作,如果出现此情况,可以考虑代理等
原文链接:https://blog.csdn.net/javajiawei/java/article/details/91456488