在没有键盘的虚拟世界里,人们会使用什么输入法?|钛金独家专访

图片来源:视觉中国
在我们现在体验的虚拟世界中,允许人们与机器交互的设备包括头盔和手,但不包括鼠标和键盘。那么在这个世界上我们如何与外界沟通呢?
在计算机时代,由于智能输入法的出现,我们的输入效率得到了提高。事实上,输入法已经从基本的TOC工具发展成为人机交互的重要组成部分。
近两年,VR/AR等虚拟世界得益于元宇宙的概念变得非常流行,由于人机交互方式的差异,技术人员也在对输入方式进行迭代创新。
去年9月,搜狗完成私有化交易,并入腾讯集团。一周年之后,腾讯输入法部总经理陆健接受了钛媒体APP等多家媒体的采访。
钛媒体APP获悉,腾讯搜狗输入法在IoT领域累计用户超过1.5亿,覆盖智能家居、智能穿戴、智慧教育、智能汽车等多个行业。
最近,他们发布了新版本的VR输入模式。是业内首款无需控制键盘即可智能识别多种输入情况的输入产品。未来将与“全现实互联网”理念相结合,提供全新的人机交互方式。。

结合VR控制器的输入方式
VR世界中的输入与真实物理世界不同。陆健告诉钛媒体APP,用户必须握住手柄,点击投影虚拟键盘上的字符,才能在3D场景中进行输入甚至交互。VR的沉浸感。
我们现在可以看到它可以承载更多的电影、电视和游戏。事实上,这是一个相对简单的要求。但如果未来VR需要承载更多的社交场景,比如我们可以在VR场景中使用耳机来获得更加沉浸式的社交体验。
这时候输入可能会更方便,无论是使用语音、手写还是打字。为了解决这些问题,我们可能需要在VR世界中用语音“敲击”键盘——搜索电影或发表评论时,我们可以通过移动嘴巴自动使用语音完成输入。
在VR的需求下,新兴技术也会运用在输入法上,比如手势算法与输入法的结合,让用户体验空中手写,而不是在虚拟键盘上打字,毕竟有时候,语音是同样在非私密环境下,当用户需要安静输入时,凌空的虚拟手写技术也将是输入法领域的下一个焦点。
目前VR输入法主要基于3D引擎的研发工作,而3D引擎非常多样化,这使得我们在对输入法进行一一适配时工作变得相当复杂。技术上,技术人员也会利用虚拟屏幕等概念来适配不同的3D引擎,进而增加输入法产品的灵活性。
陆健也坦言,在新的形势下,输入法的开发工作会相对缓慢。比如在VR场景中,他们的首要任务是创建一个基线版本,积累了基线版本后,后续的流水线必须开模具,开模具后,整个系统才能有效工作。
以下为钛媒体等人与陆健的对话实录,经钛媒体APP编辑:
问:此次发布的VR输入法能否介绍一下具体的应用案例?
陆健:早期有不同的认识。现在VR基本上还是一个独立的硬件设备,但是对于这个硬件设备,我们目前认为它确实和手机不一样,产品形态主要是头戴式显示器和控制器。为了在3D场景中进行一些输入甚至交互,用户需要握住手柄并单击投影虚拟键盘上的字符。
我们的想法是,如果VR未来承载更多的社交功能,那么它现在就可以承载更简单的需求,比如看电影、玩游戏。但是如果后期用于社交交互,比如我们在VR中使用头戴式显示器,甚至有更加沉浸式的社交体验,这个时候可能会有输入,无论是语音、手写还是打字。相应的为了更方便的应用。
所以针对以上问题,我们还打造了VR语音键盘。例如,当用户搜索电影或发表评论时,他们可以自动使用语音通过动嘴来完成输入。此外,我们还会继续探索VR中的一些新兴技术在输入法上的运用,比如手势算法与输入法的结合,让用户体验到自由手写的收益,而不是在虚拟键盘上打字,因为后。总而言之,在语音不是很私密、用户需要安静输入的环境下,灵空书法的虚拟技术也将是我们接下来的重点。
问:关于国内外各大厂商此次都针对VR布局输入法,像搜狗此次推出的输入法,在手势交互或者识别准确度等技术方面会不会有重大的改进或者亮点呢?
陆健:我可以谈谈技术。因为VR更多的是基于整个3D引擎的研发工作,而3D引擎非常多样化,所以当我们对我们的输入法进行一一适配时,工作会相当复杂。
技术上,我们也会利用虚拟屏幕等概念来适配不同的3D引擎,进而增加输入法产品的灵活性。另外,我们会解决一些导致用户输入效率低下的困难,比如调整键盘大小、添加声音和振动效果,同时增加用户徒手输入的能力,从而提高效率用户的输入和体验都可以得到极大的提升。
另外,我们也会尝试将软件和硬件结合起来,为用户提供更便捷的输入体验,比如虚拟键盘和手柄按键之间就有映射关系,用户可以使用手柄上的快捷键,也可以用于添加、删除和修改文本内容。查看。
问:从PC时代到智能设备,再到万物互联,输入法的属性正在发生变化。现阶段,智能家电和智能终端设备的输入需求有所不同,现阶段输入方式最显着的变化是什么?
陆健:腾讯搜狗输入法从2015年开始服务电视、教育平板等硬件厂商,我们积累了大量的经验,我们相信5G和AI技术的发展会让智能终端更加智能,完善软件。各路硬件厂商都在努力为用户提供便捷、智能的体验。
现阶段,我们可以明显感受到厂商在持续提升系统输入法的品质,对人机交互的检验也在不断完善。我认为这方面最显着的变化就是从单一的工具升级到万物互联的人机交互。
Q:得益于开放平台计划,与其他玩家合作的想法或模式是什么?
陆健:我们目前推出开放平台的思路更侧重于人机交互赛道,未来我们的生态合作伙伴将包括操作系统、系统中间件、字体厂商、智能终端、企业办公软件等。我们希望通过上下游生态形成完整的人机交互解决方案并与合作伙伴捆绑,进而帮助提升各行业、各场景的效率和体验,为行业用户创造价值,进而推动相关投入和生态方法。合作我们可以共同获得商业价值这是我们的核心理念。
问:通过多种基于平台的解决方案,我们可以在各个行业实现高效率吗?
陆健:对于一些新的场景,我们会比较慢。比如说VR,我们首先要做的就是建立一个基线版本,积累了基线版本之后,接下来就需要在流水线上开模型,开模型之后,后续的定制会非常快。
问:这是否也与搜狗在输入法领域多年的经验有关?
陆健:所有的产品都需要深度打磨。我以C端输入方式为例。你实际看到的只是一个键盘,但实际上当我们真正解构它的时候,有表情、有语音输入、有手写输入,还有上百种键盘输入。独自的..
比如多语言方面,我们有100多种键盘,包括粤语用户专用的粤语拼音键盘、游戏用户使用的游戏键盘、以及我们在桌面下使用的折叠屏键盘、悬浮键盘等。折叠屏。键盘体验不仅仅意味着在上面叠一个键盘,因为它需要适应模型,甚至需要自动使用深度学习方法来适应我们的手形,比如用户手大时是否有合适的键盘。自动调节的能力必须一一打磨。对此,我认为如果没有足够的时间和在这个行业积累的深度,短时间内确实很难做得很好。
Q:本次推出的新品在颠覆性创新方面有哪些新突破?您的目标用户是谁?创新生态系统是什么样的?
陆健:我们结合企业的特点推出了一个开放平台,通过这个开放平台,用户可以更快更好的定制自己的输入法。
具体来说,这个开放平台未来可以定制,一方面类似于车载。目前,大屏、多屏是主流。针对不同尺寸的屏幕,我们将提供全新的键盘布局设计,考虑到用户在主驾驶和副驾驶中的位置,让主驾驶和副驾驶在打字时拥有不同的体验,例如键盘镜像和悬浮拖动。副驾驶输入轻松。对于车载地图导航,我们还将包含专属的车载词典库。
我们甚至正在考虑使用跨屏模式来打开我们的输入框。.我们也可以用手机连接车载设备然后完全输入吗?
另外一个就是VR,我想刚才也提到了创新方面。它是一款压力式语音键盘,只需动动嘴就能完成完整的输入,还结合了手势算法,这些都是我们独特的创新。
在电视和大屏幕下面,我们还推出了二维码的跨屏输入,它是一个跨屏输入的概念,通过蓝牙连接用户的手机和终端设备后,用手机完成输入。例如,如果这个设备离我很远,我会考虑使用我们的手机扫描我们设备上的二维码。传统上,就像电视一样,是通过遥控器来进行输入的,我们可以想象在电视上看到的二维码。我们距离代码还很远,但是我们可以通过手机扫描来完成电视输入框上的输入,这样我们就不需要经常触摸遥控器来完成输入。
问:输入法解决方案有很多不同的领域,包括智能办公、智能金融等。请问,不同领域的硬件厂商,对于输入解决方案的要求有何差异?
陆健:早期我们更关注C端,比如移动端、PC端。但是后来随着产业价值的提升,我们对B端有了更清晰的认识,所以从产业需求的角度出发,我们为各个行业提供定制化,包括各种解决方案,就成为了我们优先考虑的事情。现在。
比如我们刚刚推出的生僻字解决方案,就是为了满足金融行业对生僻字进行改造的需求,当然,相对于智能家电行业,金融行业的需求差异是相当显着的,与字库、字库等的合作中间件厂商对整个生态系统进行整合改造,最终形成金融行业专属的非常规角色改造解决方案。当然,为了支持生僻字的转换,我们还推出了新的技术方案——云输入法,其中包括金融行业专属词库。
其他智能汽车行业也是如此,在每个行业中,都会有一些针对这个行业相对不同的创新,以及一些与厂商一起定制的解决方案。所以这个行业的需求现在已经和输入法应用根本分离了,输入法已经从基础的C端应用提供商工具逐渐升级为人机交互的重要组成部分。还需要与上下游厂商深度合作,完善现有系统,并根据行业需求和用户场景进行定制设计。
问:对于教育行业来说,输入法与通用输入法的区别是什么?该行业用户的需求主要集中在哪些方向?
陆健:这个场景确实是一个非常重要的场景,在这个场景中我们会更加关注青少年的身心健康。当然,与其他教育情况不同,我们也会考虑学习方法和考试方法。输入法之前的教育场景提供了屏蔽敏感词的功能,以保护青少年的身心健康。
此外,输入法的AI能力还可以帮助学生在学习过程中掌握构词、造句、诗词歌曲以及数学、物理、化学公式相关的一些知识点。当然,我们同时也会设立一个“考试方法”,给家长和老师,因为现在很多学校都用搜狗输入法,如果信息量太强,学生就可以用输入法作弊。
之前我们做金融考试的时候,很多用户问考机上有搜狗输入法吗?因为我们当时做了一个功能,使用搜狗输入法,有一个电脑功能,可以用来进行复杂的计算,因此,在“考试模式”下,家长和老师可以打开学生客户端进行考试。这种方式避免了学生上网课或考试时的信息指导,更准确地检验学生对知识的掌握程度。
问:什么样的教育机构或公司会为一种输入法付费?
陆健:这两年教育行业进行了改革,也完全电子化了,特别是在疫情的影响下,学生的远程教育会变得更加频繁。现在的学生,尤其是高年级学生,大量使用平板电脑,很多学习和考试都是在平板电脑上完成的。
我们更注重基于具体用例的定制需求,比如我们的客户需要在平板电脑上定制这样一个系统,但是这个系统必须有一套输入法供学生使用,但有时是困难的。为了满足客户的输入法需求,所以他们会围绕远程学习的情况来找我们定制这样的输入法。
问:针对不同的行业,会提出很多定制化的解决方案,对于搜狗来说,可以更专注于技术开发。不同的行业隔山相望,每个行业都有自己独特的问题和需求,在接触这些行业的过程中,你会发现这些行业的哪些客户问了你以前没有想到的问题,你就会。给你印象最深的是什么?
陆健:其实有很多,如果你坐在办公室做或者出去做,确实有很大的区别。区别。举个例子,比如之前我们在无障碍方向上做的输入,当我们面对一个残疾人看他如何输入时,他当时的输入方式还是让我们感到惊讶。
还有我们今年推出的“汉字守护者计划”。之前我们以为有稀有角色,没想到有这么多。2022)如果是这么一个水平的话,以前国家政策是互联网可以适配,今年国家强制要求的时候,我们去推广的时候才真正明白这是一个很大的痛与银行。
同样在汽车中,当我们解决主屏幕和副屏幕的需求时,我们发现主驾驶员体验和乘客输入之间存在很大差异,这是我们之前没有意识到的。我和我的产品同行的普遍看法是,我们需要走出去了解需求,现在我可以诚实地说,我们需要更多地走出去。即使都是车企,不同的车企可能会给你不同的激励。
问:因为2B行业有很多,有大中小客户,他们的需求也不同。我们的客户服务团队的策略是什么?由于庞大的用户和巨大的细分需求,搜狗目前的流程是怎样的?重点和侧重点是什么?
陆健:这个可以从两个层面来说,一方面,我们早期去配送的时候,我们更关注的是头部客户,因为我们认为头部客户的用户量比较多。将要。更好地了解他们的需求。早期我们的投放方式更注重销售与客户的对接,后来我们联系产品经理,采用点对点的投放方式与用户进行深度沟通。他们是点对点的。
但随着时间的推移,整个交互模式也会发生变化,因为我们看到整个用户群体的需求正在向一侧汇聚。配送成本的问题这也是我们这次在“腾讯数字生态大会”上想要重点关注的一点,就是我们想要用开放的平台理念和产品来帮助我们的客户。
比如说我们希望客户能够定制一些简单的输入法,比如说这个工业设备是一个医疗设备,它肯定需要快速定制一个输入法,只要选择一个医学词典,然后选择想要的键盘就可以了。类型,我们提供手写、9键、26键等。企业用户在打包的时候勾选框就生成了输入法,生成后就可以用来调试了。对于这种交互方式,我们已经完成了类的跳转。
(本文首发于钛媒体APP,采访撰稿|李成成)