跳转至

回形针事务所 014 - 为什么手机需要人工智能?

我是张每羊,这里是回形针事务所,今天我们要研究的产品是 vivo 在 3 月 10 日发布的 NEX 3S 。

你可以在这部屏占比高达 99.6% 的手机上看到骁龙 865、5G、LPDDR5+UFS 3.1 等各种目前 Android 平台上的顶级配置,但我们最感兴趣的还是 NEX 3S 在 5G 技术加持下,通过人工智能实现的一系列功能优化。

我们知道,手机的发展大致可分为功能机和智能机时代,而近五年,智能机又迈入了人工智能的进化阶段。它们之间最重要的差别在于解决问题的能力。

试想你在一家跨国企业工作,开会途中突然有中国同事打来重要电话,但你此时根本无法接听,在这种情况下,你该如何得知他传递的信息并转成英文告知你的外籍同事?

如果用功能机,你只能把电话转到语音信箱,事后再听录音、整理、翻译、发送给别人。传统智能机虽然有了各种应用程序,但也得靠你频繁操作。

而 NEX 3S 则可以在来电时,直接让电话秘书接听,电话秘书会在后台自动与来电者对话并转成文字,手机可以不出声以免打扰会议。通话结束后还可以直接截屏并在编辑模式下调起智慧识图,将对话内容翻译成英文并通过即时通讯软件告知外籍同事。

相比传统智能机只能靠不同应用程序一对一地解决简单问题,人工智能让手机在这个过程中直接帮人完成了语音识别、自然语言的理解对话、图像识别、翻译等多种复杂任务。

然而,在手机这种小巧的移动平台上实现人工智能其实并不容易。

首先算法上,你可能经常听到神经网络、深度学习这类名词,简单来说,就是让机器在海量数据中快速学习、试错、找到规律、解决问题。算法很大程度上决定了人工智能处理问题的准确度。

比如当你帮女朋友拍下这样一张照片,对机器来说,照片中不同颜色的像素其实没有任何意义,但你的女朋友却会敏锐地发现背景上的路人,并质疑你拍的不好看。

你大可不必紧张到开始自学 PS 抠图,NEX 3S 的 AI 抠图功能可以把照片上的人物、车辆、背景等元素都单独识别并分离出来,任由你去掉干扰图像、自动填充,突出女朋友的存在。

仅在人物识别上,vivo 的算法就把识别准确率提升到了 85% 左右。

算法在升级,设备的算力也得跟上。

你或许在 2016 年用过这款手机应用,把一张图片处理成不同艺术风格的效果。但如果手机算力不足,这个风格转换过程就得先让手机把数据传到云端,在服务器上经过人工智能处理完后再把结果返回手机,网速慢就可能造成延迟。

而 NEX 3S 的艺术画功能则无需联网,仅靠手机端只需几秒就能完成同样的效果。这种离线的人工智能应用,得益于目前 Android 平台算力最强的高通骁龙 865 芯片,上面的 CPU、GPU、DSP、NPU 等计算单元都会参与人工智能计算。

相比上一代,865 的 CPU 性能提升了 25% ,AI 性能提升了一倍。不仅如此,vivo 还通过自研的 VCAP 计算加速平台,让人工智能更快一步。

以视频摘要功能为例。当你拍完视频想要发在社交网络,完全不必在手机应用上耗时耗力地剪辑,NEX 3S 可以自动识别视频中的人物主角和片段,剪辑生成更精简的视频摘要。

而 VCAP 相比其他加速框架,让这个过程的人工智能计算耗时缩短了 25% 。

此外,5G 技术的加入也让手机上需要云端计算的人工智能应用响应得更快了。尤其当你身处异国出差或旅游,语言上的隔阂无疑是最大的沟通障碍。

而使用 NEX 3S 的智慧识图功能,云端的人工智能翻译只需片刻就能将带有外语的图像快速转换成中文内容;特别是在需要与人交流的即时场景下,NEX 3S 的翻译机功能还能在 5G 高网速的加持下,更加实时地提供多种语言的语音翻译。

除了算法、算力,人工智能对数据的处理同样重要。

基于大数据的云端训练,更倾向于得到一个通用的算法模型,但通用算法模型有可能让人工智能对不同用户的理解千篇一律。

NEX 3S 则凭借自身强大的算力,以及在 VCAP 计算加速平台的帮助下可以直接实现手机端的人工智能训练。比如智能通知就是靠端侧训练,让手机学习用户的操作习惯,在推送通知时展开那些你个人高频查看的应用通知,自动折叠那些你不经常看的通知。

而这都是为了让人工智能更懂人,也更懂你。

所以你会发现,NEX 3S 还能在你靠近地铁时,自动为你提供乘车码的服务;在手机快没电时,快速匹配附近的充电服务;在你观看商品图片时提供网购链接;在你出行停车时,帮助记录停车位置。

所有这些基于人工智能的体验都是为了让手机不仅成为你的助手,更成为你的化身。而你也会更强烈地感受到,相比 “Smartphone” ,“Intelligent Phone” 才是真正的智能手机。