印度目前有6个以上。
1亿互联网用户,但只有一小部分人能流利地说英语。然而,目前印度的大多数在线服务和网络服务只提供英语。这种语言障碍造成了世界第二大互联网市场的数字鸿沟,从而让数亿用户只能使用少数网站和服务。
因此,越来越多的科技公司试图为更多的印度人提供互联网服务。周四,谷歌宣布了一系列措施,在其产品中使用更多的印度当地语言,并提供全新的语言翻译方法。
此外,谷歌表示,计划投资谷歌在印度的研究中心,推动机器学习和人工智能的发展,并向整个生态系统中的所有人开放人工智能模型。谷歌承诺在未来几年投资印度。
100亿美元,并与当地初创公司合作,以当地语言向印度用户提供服务,并大幅提升谷歌产品和服务的体验。
除了目前可用的英语和印地语,谷歌还将看到泰米尔语、泰卢固语、孟加拉语和马拉地语的搜索结果。这项新功能是在谷歌在印度搜索页面中添加印地语标签四年后推出的。该公司表示,推出该选项卡后,印地语搜索查询数量增加了10倍以上。例如,如果有人更喜欢看到他们的泰米尔查询,现在他们将能够将泰米尔标签设置在英语旁边,并在两者之间快速切换。
获取本地语言的搜索结果非常有帮助,但是人们经常想用这些语言进行查询。谷歌表示,它发现用非英语语言打字是目前用户面临的另一个挑战。为了解决这一挑战,搜索将在适当的时候开始以支持的印度语言显示相关内容,即使本地语言查询是用英语输入的。该公司计划下个月推出这项功能,支持五种印度语言:印地语、孟加拉语、马拉地语、泰米尔语和泰卢固语。
谷歌还让用户更容易在应用程序中快速更改查看结果的首选语言,而无需更改设备的语言设置。该功能目前在Discover和Google中提供。
助手,现在将在谷歌地图中提供。同样,谷歌眼镜的作业
功能,允许用户对数学或科学问题拍照,然后提供答案。现在支持印地语。
谷歌高管还详细介绍了一种新的语言人工智能模型,他们称之为印度语言的多语言表示(MuRIL),在处理翻译、拼写变化以及混合语言和其他语言的细微差别方面提供了更高的效率和准确性。谷歌
印度研究中心的研究科学家帕萨
塔鲁克达尔在周四的一次虚拟活动中表示,穆里尔在用罗马字母书写印地语时为翻译提供了支持,这是以前的类似模式所缺乏的。
该公司表示,它使用维基百科的文章和一家名为“共同”的公司的信息。
爬行的数据集来训练新模型。它还训练来自维基百科和其他来源的翻译文本(通过谷歌现有的神经机器翻译模型的反馈)。因此,MuRIL处理印度语言的能力优于之前更通用的语言模型,它可以处理已经翻译的字母和单词。
——也就是说,谷歌使用不同字母或字符最接近的对应字母。