使用率太低!谷歌停止向中国大陆提供翻译服务

news/2024/7/5 1:43:56

点击关注公众号,Java干货及时送达👇

来源:公众号「新智元」

就在这两天,有网友突然发现谷歌翻译用不了。

(虽然谷歌退环境了,但翻译一直是能用的)

3438c13d08594f363cd134da2e9b3cec.png

具体来说,本应提供翻译功能的translate.google.cn,被替换成了一个所谓的「搜索页面」。

就是长下面这样的:

b1fff74da762981c72f994ba9bbe9a26.png

那么问题来了,谷歌不是早就退出了么,哪儿来的搜索?

没错,因为这就是个「截图」而已……

25f9b4b7d548f0dcb491c3763ba50238.png

不管你点击哪里,都会直接被重新定向到谷歌翻译的香港域名——translate.google.hk。

显然,这个对于大陆的用户来说,是无法访问的。

e026fc5740c16f9a65e443943553886c.png

于是,不管是谷歌Chrome内置的翻译功能,还是其他调用了这一接口的软件,比如KOReader(一种文档查看器),都祭了……

be4b450dc8f5eb0cd99254abaf50b99b.png

顺便一提,谷歌2010年退出中国内地市场。

c4ad16240daa9e4e34a6f4dfe6f97bbc.jpeg

时任工业和信息化部部长李毅中同年3月12日在回应「谷歌退出中国事件」时说,中国的互联网是开放的,进入中国市场就必须遵守中国法律。

此前曾有报道称,谷歌在2018年和2019年都曾尝试过在中国大陆重新启动搜索服务。

作为「蜻蜓计划」的一部分,该项目将对搜索结果进行审查,并记录用户的位置以及他们的互联网浏览历史。

但据The Intercept报道,在经历了由内部隐私团队牵头的冲突之后,谷歌彻底放弃了这一计划。

曾陷「辱华」风波

去年11月,有网友发现谷歌翻译会将一些艾滋病相关的词翻译为中国侮辱性词汇,引发对谷歌翻译的反感和愤怒。

在英翻中的英文对话框输入「新闻」,「传播」等词汇,中文部分显示的仍然是「新闻」和「传播」。

但在英文对话框输入「艾滋病毒」等类似词汇,中文翻译就会显示恶毒攻击中国的词汇。

不过,谷歌很快便在微博上表示,问题已经得到了解决,并解释称是由「模式」引发的。

也就是说训练语料要背大锅,如果训练语料存在夹带私货的情况,那翻译结果也不会准确。

e6ff285517a6dc1f834dcdd840e1c4b3.png

对此,「NeX8yte」指出,国际互联网上中文的语料大部分并不掌握在我们自己手里,而且此类结果很可能是经过了中介语言,从而也就放大了错误。

银蓝剑6H17也表示,这种结果的出现一方面是机器学习用了脏语料,让部分中文输入也可以输出翻译结果,另外一方面就是模型到API的调用阶段管理出现了真空。

「曹哲的杂货铺」认为这是有意制造的:

为什么恰好会有人找到谷歌翻译,又恰好翻译这些并不常用的词语,又双叒叕恰好把忽略系统建议硬把源语言设成「英文」呢?

输入一段中文,然后硬告诉程序这是英文,让他把这玩意「翻译」成中文,其直接后果无非就是程序被你玩炸了,程序会认为这条「英文」它不会翻译,这时候只要有心人把这个用汉语写成的「冷门英文单词」在翻译社区提交翻译建议,就很容易达成这种结果。

参考资料:

https://tcrn.ch/3E6HC3b

热门内容:
  • 这样做优化,实现 0.059s 启动一个SpringBoot项目!

  • 9月19日真实虾皮裁员经历...

  • 微软全力拥抱 Java !

  • 真赔麻了!!一个BUG和一个回帖直接赔了20万!

  • 面试官问:select......for update会锁表还是锁行?

  • 一次堆外内存泄露让整个团队通宵处理到爆肝!

0d7377e66c53ea622bd5a78a61c000fb.jpeg

最近面试BAT,整理一份面试资料《Java面试BAT通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式:点“在看”,关注公众号并回复 666 领取,更多内容陆续奉上。

明天见(。・ω・。)


http://lihuaxi.xjx100.cn/news/253426.html

相关文章

破题数据中心绿色可持续发展

可持续发展,已经成为了当下各行各业都无法绕开的话题,数据中心的低碳可持续发展探索之路更备受关注。当下,日益深化的数字化转型不仅让越来越多的企业享受到IT技术与网络的价值,也驱动了数据中心强劲的增长态势,必然将…

一份招聘需求的分析

今早,长期合作伙伴又给我们一份招聘需求,以下是招聘条件: 工作性质:全职 工作地点:南京 发布日期:2009/6/15 截止日期:2009/6/30 招聘人数:6 工作经验:不限 学  历&…

【第13周复盘】小朋友们也开始卷了

「青少年编程竞赛交流群」已成立(适合6至18周岁的青少年),公众号后台回复【Scratch】或【Python】,即可进入。如果加入了之前的社群不需要重复加入。 微信后台回复“资料下载”可获取以往学习的材料(视频、代码、文档&…

PYTHON黑帽编程1.5 使用WIRESHARK练习网络协议分析

Python黑帽编程1.5 使用Wireshark练习网络协议分析 1.5.0.1 本系列教程说明 本系列教程,采用的大纲母本为《Understanding Network Hacks Attack and Defense with Python》一书,为了解决很多同学对英文书的恐惧,解决看书之后实战过程中遇…

如果你的云服务商倒闭该怎么办?

如果你的云服务商倒闭或暂时中断服务,以下4个步骤能够帮助你的企业把损失减少到最低。 2009年2月,云服务商Coghead在一封写给客户的电子邮件中宣布该公司"由于受到经济挑战的影响",将立即终止基于云的开发平台服务。随后&#xff0…

基于 NumPy 实现随机梯度下降算法

作者 | 云朵君来源 | 数据STUDIO今天和大家一起学习非常常用的一种优化算法:梯度下降,在机器学习应用中经常被用来寻找对应于预测和实际输出之间最佳拟合的模型参数。这是一个不精确但强大的技术。接下来我们就一起学习吧!本文较长&#xff0…

如何解决Python3写入CSV出现‘gbk‘ codec can‘t encode的错误

今天,我在 Windows 上用 Python3 爬取知乎上有关中医的问答,但是在把爬取的内容写进CSV文件的时候,出现了以下异常。 UnicodeEncodeError: gbk codec cant encode character \u2630 in position 3969: illegal multibyte sequence经过上网查…

SSIS中的记录集目标

这一篇,我们来看看另外一个特殊的目标组件:记录集目标。它与DataReader目标有些类似,也是在内存中的。但与DataReader目标不同的是,它可以被下游任务使用。 它的使用也比较简单,我们一般指定一个变量来接收它的结果&am…