都在聊VR,那么怎样才算把VR交互做好?



目前而言,VR产业的三大链条,显示,内容和交互中,显示和内容已经有了比较成熟的标准。领跑的三家VR眼镜公司,Oculus,索尼和Valve已经将其他竞争者甩在身后,而自己建立了平台和标准:Oculus依托财大气粗的Facebook,索尼则有自己的主机平台,而Valve本身就是超强的内容生产商和平台服务提供商(Steam)。


才结束的2015年度Chinajoy上,VR也成了一大热点,各路VR厂商各显神通,索尼还带来了他们的Project Morpheus供国内玩家体验,而Unreal也带来了Oculus Crescent Bay这个最接近于CV1的版本。但是在大家热火朝天的讨论着VR,各种VR头显大行其道(包括国内国外的)的同时,VR的另一个主要环节——交互,却被忽略了。


Oculus Touch,VR手柄


人机交互的历史


当电脑还是一个沉重庞大的玩意儿的时候,与计算机的交互并不是一个很被重视的事情。那个时候的计算机是十分专业的工具,操作它的也是受过严格培训的人员。一开始工程师们使用各种可以插拔的线缆或者继电开关,后来使用打孔卡片与计算机交互,本意上都是为了提高效率。后来显示器的出现让计算机配上了键盘,而图形用户界面(GUI)则让鼠标变成了计算机的标配,在这个过程中微型计算机的出现让计算机的用户扩散到了没有受过训练的普通人。

所以,在这个过程中,我们有一条重要的历史经验:对于普通人的人机交互设计,和对于专业人士的人机交互设计是有着不同的目的。


如果目的很复杂,那么手段也需要很复杂。前者,我们有一个键的iPhone;后者,我们有至少200个功能按钮的Photoshop和无数命令的LaTeX,而这两者是不能够通约的——用户不会去花三个月时间学习怎么做一个基本的电脑操作,而想要用一个键+触摸屏就达成Photoshop的主要功能或者用WYSIWYG(What You See Is What You Get,所见即所得)的方法来排版LaTeX文档,都属于南辕北辙。


VR交互没有通用方案


所以,实际上,VR交互从某种意义上更像是对位于包含目前的鼠标键盘/手柄/触屏的“平面图形交互”的大类,我们可以称之为“空间图形交互”。


2D交互主要是有3个交互模式:

  • 在办公和桌面系统中我们使用鼠标键盘,这一套系统为我们提供了最多的操作选择;
  • 在游戏领域,我们使用手柄,操作选择十分有限而且高度特化;
  • 在移动领域,触屏成为了主流的交互方式,它适合于灵活多变但是深度极为有限的交互。


使用不适合场景的交互方式效率是很低的,苹果就公开表示他们不会在笔记本上加上触屏,因为桌面操作本质上不适合触屏,而现实则印证了苹果的观点。如果将触屏操作和桌面交互杂交起来的Windows 8只会收获一片批评。



正如同平面图形交互在不同的场景下有着不同的方式,VR交互同样不会存在一种通用的交互手段,我们不会指望使用一套通用的交互方式和交互设备来搞定所有的事情。目前VR交互设备已经有很多,我们可以合理预测,在未来VR产业真正主流之后我们会迎来比较成熟的用于VR交互的不同手段。


VR交互隐喻的两个目标,是“替代”与“超越”


作为VR交互,首先就要能够完成目前平面图形交互的所有功能,也就是说,“替代”。


我们需要在三维的VR空间中能够点击、滑动、滚动、拖拽,操作虚拟键盘(使用触屏操作虚拟键盘不如实体键盘的体验,但是用户可以接受),这一切能够在平面图形交互中完成的功能。但同时,要让用户能够“不累”也“不傻 ”的完成这些任务。


键盘鼠标、手柄和触屏的共同特征,是让用户在操作的时候所需要花费的体力成本很低。苹果在强调他们为什么不会给笔记本加触屏的时候就提到,用户不会悬着手臂去触摸垂直屏幕上的元素,因为这个操作是很累的。任何需要悬空手臂的操作都不会被用户接受,早年的《少数派报告》中的手势操作虽然酷炫,但是只要自己尝试一下就知道这样的操作大概坚持不了五分钟。Leap Motion的失败很大程度上,也是因为悬空手势操作。



与体力相对应的是脑力。用户需要非常明确,不需要学习和训练的交互方式,而不是将交互方式隐藏在层层菜单和教程之下,或者复杂到尝试10次只有5次能够成功。凌感科技的费越博士表示,在此前对于手势操作的研究中,除非是直接与虚拟物体的交互,用户是非常难以发现手势的。


第二个目标就是“超越”,能够完成在平面图形、甚至在现实世界中所无法完成的功能。


比方说,更加直观的与3D物体交互,将一些以往只有在专业软件如MAYA或者3DS Max里才能做的操作变成直觉而不需要学习的操作。


超越平面交互-更适合虚拟现实的场景和交互


另一个有趣的例子,是VR界名人Oliver Kreylos博士在SVVR(硅谷虚拟现实大会)的交互座谈上曾经谈到过,在虚拟场景中进行远距离移动,用户发明了一种手势,类似于将场景本身缩小然后再把远处的地点“拉”过来。这样类似的交互隐喻在VR真正兴起之后一定会大量出现。


不同的VR交互会有不同的设备


虚拟世界要比平面图形多一个维度,VR的交互也要比平面图形交互拥有更加丰富的形式。目前来看,针对不同的场景,VR交互所使用的设备也分化了。


用户想要获得完全的沉浸感,真正“进入”虚拟世界,动作捕捉系统是必须的。目前专门针对VR的动捕系统,目前市面上可参考的有 Perception Neuron,其他的要么是昂贵的商用级设备,要么完全是雾件。但是这样的动作捕捉设备只会在特定的超重度的场景中使用,因为其有固有的易用性门槛,需要用户花费比较长的时间穿戴和校准才能够使用。相比之下,Kinect这样的光学设备在某些对于精度要求不高的场景可能也会被应用。


编者注:所谓雾件,Vaporware又称为announce ware,意为在开发完成前就开始进行宣传的产品,也许宣传的产品根本就不会问世,它们可以是软件、硬件,甚至只是一种服务,这个具有讽刺意味的词也代表着互联网行业的一种营销策略。



VR动作捕捉


全身动捕在很多场合并不是必须的,它的另一个问题,在于没有反馈,用户很难感觉到自己的操作是有效的,这也是交互设计的一大痛点。


对于这个问题,最快最简单的解决方式还是按钮和震动反馈:这就是下面要提到的一大类,虚拟现实手柄。


目前三大VR头显厂商(Oculus,索尼,Valve)都不约而同的采用了虚拟现实手柄作为标准的交互模式:两手分立的、6个自由度空间跟踪的(3个转动自由度3个平移自由度),带按钮和震动反馈的手柄。这样的设备显然是用来进行一些高度特化的游戏类应用的(以及轻度的消费应用),这也可以视作一种商业策略,因为VR头显的早期消费者应该基本是游戏玩家。但是,这样高度特化/简化的交互设备的优势显然是能够非常自如地在诸如游戏等应用中使用,但是它无法适应更加广泛的应用场景。


我们可以想象,与目前类似移动设备上触屏交互这样灵活多变但深度有限的交互方式的VR相对应,应该是手势跟踪。


形而上地说,双手是人类的元工具;人类之所以成为人类,就在于解放了双手,一切工具都是手的延伸,包括鼠标键盘手柄触屏。所以在虚拟世界之中,直接用手势作为交互的工具也是一个很自然的想法。


使用手势捕捉作为交互可以分为两种方式:第一种是使用光学跟踪,比如Leap Motion和NimbleVR这样的深度传感器,第二种是将传感器戴在手上的数据手套。两种方式各有优劣。



数据手套


光学跟踪的优势在于使用门槛低,场景灵活,用户不需要在手上穿脱设备,未来在一体化移动VR头显上直接集成光学手部跟踪用作移动场景的交互方式是一件很可行的事情。但是其缺点在于视场受局限,以及我们之前所提到的两个基本问题:需要用户付出脑力和体力才能实现的交互是不会成功的,使用手势跟踪会比较累而且不直观,没有反馈。这需要良好的交互设计才能弥补。


数据手套,一般在手套上集成了惯性传感器来跟踪用户的手指乃至整个手臂的运动。它的优势在于没有视场限制,而且完全可以在设备上集成反馈机制(比如震动,按钮和触摸)。它的缺陷在于使用门槛较高:用户需要穿脱设备,而且作为一个外设其使用场景还是受局限:就好比说在很多移动场景中不太可能使用鼠标。不过这些问题都没有技术上的绝对门槛,完全可以想象类似于指环这样的高度集成和简化的数据手套在未来的VR产业中出现,用户可以随身携带随时使用。


这两种方式各有优劣,可以想见在未来这两种手势跟踪在很长一段时间会并存,用户在不同的场景(以及不同的偏好)使用不同的跟踪方式。


在虚拟世界中移动


人们进入虚拟世界不仅仅是想坐在那里,他们也希望能够在虚拟世界中到处走走看看。从某种意义上这是VR交互里“超越”平面交互的部分:平面交互从来与用户的身体无涉。


所以也诞生了各种让人“原地”就能在虚拟世界中移动的办法。


最简单最直接的想法是万向跑步机,目前Virtuix,Cyberith和国内的KAT都在研发这种产品。然而体验过的人都反应过,这样的跑步机实际上并不能够提供接近于真实移动的感觉,体验并不好。还有的想法是使用脚上的惯性传感器使用原地走代替前进,比如StompzVR。


Virtuix-Omni其实体验并不接近真实移动


反过来同样也有人做:在虚拟世界中移动的办法是提供一个能够自由移动的真实场地。


虚拟世界的墙壁、阻挡和边界都与真实场地完全一致。超重度交互的虚拟现实主题公园The Void采用了这种途径。仔细的规划关卡和场景设计就能够给用户带来万向跑步机等种种外设所不能带来的良好体验。


或者,在VR内容的设计里,干脆就不允许自由移动——这也同样是一个办法。


VR社交网络AltspaceVR就不允许用户移动,只能通过操作来传送。这需要良好的交互设计来支撑——正如前文的OK博士所说,一套新隐喻让用户能够更加顺畅和自由的与VR交互,是现在交互厂商所需要思考的。


无可限量的VR交互


人机交互方式包含两个层面:设备的和隐喻(metaphor)的层面。施乐发明了图形界面,引入了鼠标,确定了图形交互界面的一系列基本范式,我们称之为隐喻:比如多窗口,文件夹,菜单,等等;任天堂推出了红白机,则将手柄的设计固定下来,并且同样确定了一套游戏操作的隐喻;而iPhone最终将触屏界面的隐喻确定下来,让所有的触屏设备都遵循同样的交互范式。


目前VR交互的设备已经有不少,但是没有真正的所有人都认同的交互方式。这套标准的确立将会是VR产业真正成熟的标志,我们都在探索中等待。




// share