AI 创新的 11 种方法 | Google I/O 大会精彩回顾

文 / Christine Robson,Google Research 产品总监

AI 是 Google 所做工作中不可或缺的一部分。计算领域的重大进步正在帮助我们应对本世纪最重大的一些挑战,气候变化就是其中之一。与此同时,AI 也在助力我们全系列产品的更新,包括搜索、地图和相册,这些更新展示了机器学习是如何以宏观或微观的方式改善着人们的生活。

要是您错过了其中某些内容,不妨来了解我们在 Google I/O 大会 上发布的一些由 AI 助力的更新吧。

自然语言理解领域的重大突破:LaMDA。

人类对话颇为复杂,这些对话以我们一生中掌握的众多概念为基础,由各种合理而具体的反应组成,并以一种开放的方式展开。LaMDA,意为“对话应用的语言模型”,是一种建立在 Google 发明的开源神经网络架构 Transformer 之上,专为对话设计的机器学习模型。我们认为这一早期阶段研究能够开启与技术交互更自然的方式,并催生全新类别的有益应用。详细了解 LaMDA

我们的新 AI 语言模型 MUM,最终将帮助 Google 搜索变得更加智能。

我们于 2019 年发布了 BERT,这个 Transformer AI 模型能够更好地理解 Google 搜索背后的意图。多任务统一模型(Multitask Unified Model,简称 MUM)比 BERT 强大 1000 倍,是我们的最新里程碑。它能同时学习 75 种语言(大多数 AI 模型一次只能接受一种语言的训练),还能理解文本、图像、视频等各种类型的信息。

我们仍处于探索 MUM 的早期阶段,但我们的目标是,有一天您可以输入一个信息密集长句而且听起来很自然的查询,比如“我已经登上过亚当斯山,明年秋天我想去登富士山,我应该做哪些不同的准备?”然后还能更快地找到您需要的相关信息。详细了解 MUM

Project Starline 将为您营造“在一起”的感觉。

想象您正透过一种神奇的窗户观察,您看见了另一个人,一个真人大小的三维影像。你们可以自然地交谈、做手势,进行眼神交流。

我们借助 Project Starline 让人与人重建联系

我们借助 Project Starline 让人与人重建联系

Project Starline 是一个软硬件技术进步结合的技术项目。借助这一项目,朋友、家人和同事即使各自身在不同城市(或国家/地区),也能有置身于同一空间的感觉。为实现这种体验,我们应用了计算机视觉、机器学习、空间音频和实时压缩等研究成果。我们研发出一种场景显示系统,无需额外的眼镜或耳机,就能创造出一种立体感和深度感。这种感觉就像那人就坐在您对面。详细了解 Project Starline

十年之内,我们将建成世界上第一台实用的可纠错量子计算机。这一切都将在我们的新 Quantum AI 园区实现。

从气候变化到下一次大流行病,面对世界上诸多重大挑战,我们需要一种新的计算科学。一台实用的可纠错量子计算机能帮助我们模拟自然界的复杂性,使我们得以研发新材料、更好的电池、更有效的药物等等。新的 Quantum AI 园区既是研究办公室的大本营、制造设备的所在地,也是我们的首个量子数据中心,它将帮助我们在 2030 年之前建成这种计算机。详细了解我们在 Quantum AI 园区的工作

Google 地图将帮助您减少开车时的急刹车次数。

Google 地图即将使用机器学习来减少您遭遇急刹车的几率。之所以出现这种急刹车的情况,通常是因为遇到突发的交通堵塞,或对该走哪个高速出口感到困惑。

当您在 Google 地图中获取导航信息时,我们会基于各种因素计算您的路线,比如一条路有几个车道或路线需要绕行多少。在这次更新中,我们将考量出现急刹车的可能性。Google 地图将为您确定两条最快的路线,然后自动推荐急刹车次数较少的那条路线(前提是预计抵达时间大致相同)。我们相信,这些变化每年可能消除在使用 Google 地图的行驶路线中超过 1 亿次的急刹车事件。详细了解有关 Google 地图的更新

您在 Google 相册中的“回忆”将变得更加个性化。

借助“回忆”功能,您就可以回顾往年的重要照片或是上周的精彩瞬间。利用机器学习能快速识别出您照片中那些不太明显的模式。从今年夏天晚些时候起,当发现一组三张或三张以上的照片具有类似的形状或颜色等时,我们将在“回忆”中为您突出显示这些小模式。例如,Google 相册可能会识别出您和家人多年来坐在同一个沙发上闲聊的模式,或许您从未想过要搜索这些,但它们却讲述了您日常生活的有意义故事。详细了解有关 Google 相册的更新

“电影时刻”(Cinematic moments) 让您的照片生动有趣。

当您想拍出一张完美的照片时,您通常会对着同一个画面拍摄两三次(或许 20 次)。利用神经网络,我们可以选取两张几乎相同的图像,通过在它们中间创建帧来填补两个画面之间的空白。如此一来,我们就能创造生动逼真的动态图像,我们称之为“电影时刻”(Cinematic moments)。

对专业动画师而言,从头开始制作这种效果需要花费数小时,但借助机器学习,我们可以自动生成这些时刻,并将它们放入“近期的精彩瞬间”。最棒的是,您不需要特定的手机,无论 Android 还是 iOS 系统,每个人都可以使用“电影时刻”。详细了解 Google 相册中的“电影时刻”。

在 AI 的帮助下,“电影时刻”让您的照片生动有趣

在 AI 的帮助下,“电影时刻”让您的照片生动有趣

Google Workspace 的新功能让协作更具包容性。

在 Google Workspace 中,辅助写作将适时建议使用更具包容性的语言。例如,它可能会建议您使用“chairperson”而不是“chairman”,或者使用“mail carrier”而不是“mailman”。它还能为您避免被动语态和冒犯性语言提供其他风格建议,这可以加快编辑速度,并帮助您取得更好的表达效果。详细了解有关 Google Workspace 的更新

借助“购物图表”(Shopping Graph),Google 购物能向您展示满足您特定需求的最佳产品。

为帮助购物者找到他们正在寻找的商品,我们需要根据图像、视频、在线评论甚至当地商店库存等信息,深入了解所有可供销售的产品。进入“购物图表”即可看到:我们的 AI 增强模型能够跟踪产品、卖家、品牌、评论、产品信息和库存数据,以及所有这些属性之间的关联。每天用户通过 Google 购物超过 10 亿次,“购物图表”将用户与全网数百万商家的 240 多亿条商品名录联系起来,使这些会话更加有用。详细 了解我们如何与商家合作,为您提供更多购物方式

皮肤病学辅助工具可以帮助您了解自己的皮肤状况。

每年我们都会发现数十亿次与皮肤、指甲和头发有关问题的 Google 搜索,但仅仅通过文字来描述您所看到的皮肤状况是十分困难的。

AI 驱动的皮肤病学辅助工具是一款基于网络的应用,已获得 CE 认证,我们的目标是今年晚些时候在欧盟对其进行早期测试。有了它,您就能更轻松地了解自己的皮肤可能出现了什么健康问题。只需使用手机摄像头,从不同角度拍摄三张皮肤、头发或指甲问题的图像即可。然后工具会询问相关问题,比如皮肤类型、问题出现时长,是否有其他症状等等,以帮助 AI 缩小病症范围。AI 模型会分析所有这些信息,然后根据它掌握的 288 种疾病的知识列出您可能所患疾病的清单,以供您进一步诊断。这款工具并不是要取代医学诊断,而是助您更轻松地初步了解情况。详细了解 AI 驱动的皮肤病学辅助工具

AI 还能帮助改善结核病的筛查。

结核病 (TB) 是世界范围内导致死亡的主要病症之一,每年感染 1000 万人,对中低收入国家/地区民众造成的影响尤其严重。由于它的症状与其他呼吸道疾病非常相似,所以早期诊断非常困难。胸部 X 光检查可以帮助诊断,但读片专家也无法持续地工作。正因如此,最近世界卫生组织 (WHO) 建议 使用技术来帮助筛查和分诊结核病。Google 研究人员正在探索如何利用 AI 识别潜在的结核病患者以对其进行跟进检测,希望能够及早发现并根除这种疾病。详细 了解我们正在进行的结核病筛查研究

原文:11 ways we’re innovating with AI
中文:TensorFlow 公众号