Facebook 的愿景以及虚拟现实的未来

3

对与科技公司来说,关注 CEO 有时候不如关注 CTO 得到的干货多。而 Facebook 今年 F8 大会的第二天,开场就是 Facebook 的 CTO 以及 Oculus 公司的首席科学家。他们两人,共同告诉了我们接下来十年 Facebook 想要达到的一切。

上来,先是 Facebook 的 CTO Mike Schroepfer 介绍 Facebook 的愿景。作为世界最大的网络社交平台,在接下来的十年中 Facebook 希望能成为一个更紧密地连接人与人之间关系的通道。但他们打算如何去做呢?有三个问题亟待解决。

第一:Facebook 需要建立一个全球化的基础设施系统来连接整个世界,覆盖那些没有互联网的地区。

第二:Facebook 需要开发出一个自然的交互方式来处理日渐杂乱的信息,保证人们不被信息海洋所淹没。

第三:Facebook 需要打造虚拟现实,来让人们和自己愿意的人在愿意的地方,进行自己想要的体验。

而为什么 Facebook 想要通过解决这三个问题来达到它的目的呢?Mike 以历史的变迁打了比方:基础设施就是信息传递的方式 – 从马车到火车到电报到电话,这些东西都是传递信息,连接人类的方式,对于这个层面的问题来说,效率是最重要的。然而,到了电话,有史以来第一次人类有了一种自然的交互方式,人们可以通过通话中对方的语调来判断情绪,进行深层次的交流 – 到了这个层面,讲求的是设计,如何通过设计来强化人与人之间的交流,也就至关重要了。虚拟现实则是这一切的终点,因为交流,不过是和你的交流对象在某一个空间里进行的特定体验。

这是 Facebook 接下来十年的主要任务,那么,他们现在已经做到了什么地步了呢?

facebook-data-center

这是 Facebook 建立的四个开放计算项目中心,里面的结构、组件都由 Facebook 工程师设计制造,其效率相比一般的设计,一年仅在硬件层面就为 Facebook 节约了20亿美金。这个项目在四年前就已经全部开源,大受业内好评,任何人都可以根据自己的需要参考 Facebook 的设计来组建自己的计算服务中心。

光是硬件当然不够,软件层面,Facebook 则有高性能PHP虚拟机 HHVM,之前也已经开源,Mike 同时宣布前端方面 React Native 开源。

而在网络方面,现在大约有11亿到28亿人是生活在移动网络覆盖范围之外的。在这些范围内无法铺设基站,因为从任何层面来算账都划不来,在人口密度过低的地区建立大规模的基站实在是浪费又不环保。那有什么降低成本的方式吗?

Facebook 给出的答案是无人机

facebook-drone

这些无人机为太阳能机翼,翼长超过波音737,但质量只有一部小轿车那么重,会在18公里-27公里的高空飞翔,一次起飞将滞空三个月,为偏远地区带来移动网络的覆盖。今年下半年 Facebook 会为大家披露更多信息,这也算是他们对 Google Fibre 和气球的回应吧。

这是在基础设施方面,Facebook 做出的努力 – 将整个世界用网络连接,同时给开发者们提供建设移动互联网的服务器、底层以及前端工具。

至于自然交互的方式,目前最需要解决的就是信息噪音。现在的我们被信息海洋所淹没,每天都有大量未经过滤的信息传递给我们。这该怎么办呢?Facebook 在人工智能的领域也有了一些进展 – 图片对于机器来说不过是像素的集合;但是一些特定的东西,其像素组合是有规律的。Facebook 的人工智能目前仅靠像素分析,就能分清楚400多种不同的运动,而且还是视频来着。

但真正困难的是对话背景。比如说这个问题:我在办公室,小明在球场打篮球。我接了个电话,我在哪?

对于人来说,这个问题再简单不过,但对于计算机来说,这几乎是天书 – 因为要回答上面的问题,实际上要求的是有一个完整的世界框架,知道世界的基本运行方式。

而 Facebook 则采用了一种叫做 Memory Network 的方式,模拟人的大脑,能即时地学习目前的状况并回答问题。而实现出来最后的结果就是能阅读懂一段关于魔戒的阅读理解,并能以类似人的方式回答相关问题。这是仅仅六个月前 Facebook 的突破。

而当这些东西成功之后,人工智能就能够开始为你挑选你需要的信息 – 你喜欢什么,你讨厌什么,尽在掌控。你将不为你不感兴趣的信息所扰,你宝贵的时间都会放在自己喜欢或者需要的事情上。

实际上,在个人助手这个层面,另外三大巨头都已经有面世的产品:Google 的 Google Now,苹果的 Siri 以及微软的 Cortana。以后在这个层面就是赤裸裸的人工智能水平的高下之争了。

接下来 – 就是关键的:虚拟现实。

dk2-disassembled

对于 VR,疑问也更加多:VR 这个概念挺棒的,但是为什么会是现在呢?毕竟这是在上世纪80年代就已经被定义下来了的概念。

原因在于 – 一个 VR 头显里的每一个部件,只有在今天,才到了能够在整合起来后,得到让虚拟现实真正有意义的一个最低门槛 – 临在感效果的水平。

  • 比如,屏幕只有到了今天,才能在一个5-6寸的面积里放下 1920 × 1080 以上像素,且开关速度达到2ms级别的水平。
  • 比如,追踪只有到了今天,才能够以足够低的价格保证0.25°以下的角度误差,0.1毫米以下的位置误差的水平。
  • 比如,延迟只有到了今天,才能保证在20毫秒以内,完成次世代级别的画面渲染。

而所有这些部件制作出来的价格,只有到了今天,才能达到为消费者接受的程度,且能保证消费者能体验到进入另一个世界 – 临在感的感受。

而每一个部件,每一个核心技术必须要达到一个最低要求,所以我们才能将它们组合到一起,成就一个虚拟现实的体系。

facebook-battlezone

这是1980年的虚拟现实坦克驾驶模拟游戏。你们觉得自己在坦克里吗?

而下面这个,则是今年将会发布的一款虚拟现实游戏:EVE: Valkyrie 的游戏实际视频:

想象一下,1:1完全地坐在一个驾驶舱里……从此,“我们的征途是星辰大海”可以不再只是口号。

在现场放完这段视频后,Mike 问大家:”你们能感受到冲出隧道那一刹的作用力吗?你们今年就能在 VR 里感受到。”

“你们能够……(意味深长地暂停3秒,眼珠不停转动,嘴角抽动)在 Oculus 发布的某款产品中玩到这个……” 介绍了一下新月湾原型机,告诉大家这款原型机终于能做到让人的潜意识认为自己进入了另一个世界 – 当你在 VR 中看到自己站在悬崖边上时,你没有办法迈动自己的脚,即使你的理智非常清楚明白自己正在一个安全的房间里。“我们今年终于可以通过消费级的产品达到临在感的最低要求。”

但是,这个和 Facebook 有什么关系呢?Mike 问了大家一个问题:“你们中有多少人是自己一个人去电影院的?”

“为什么你会和别人一起去一个封闭的空间里,也没有办法和他人交流,只是一起盯着一个大屏幕?为什么不一个人去?”

因为,你和他人在一起,共享一个空间,创造了一段体验和回忆。无论是在去的路上的兴奋和回来的路上的探讨,你和你的家人、朋友、爱人共享了一段体验、生活。

“而这种体验,是人和人之间交流的本质,也是 Facebook 的最终愿景和终极任务。”

正是和在乎的人在一起,体验才有了意义。那些无法赶到现场的人。那些生活中的每一个惊喜。那些天涯海角的眷念。

“四天前,我四岁的女儿第一次自己骑上了一辆小自行车。那一刻,我想让她的爷爷奶奶舅舅舅妈都看到,我希望所有人都能被传送到那里,分享我的喜悦。”

因此,这种让人真的从最低层的潜意识感觉到被传送到另一个地方的临在感和世界上最大的社交平台,就在这一刻融合。

facebook-goal

而这,就是 Facebook 接下来十年的目标 – 真正地把人带到一起

而你,对“真正”这个词,可能嗤之以鼻 – 虚拟现实嘛,再怎样也是假的。

但是,安东尼贾逵称:现实是塑料,你想怎么弯,就能怎么弯(咦)

阿尔弗雷德说:地图并非疆域。

心经有云:色不异空,空不异色。

不过对于理科生来说,上面这些都是歪门邪道,我们要用科学的方法!来证明这个世界是假的,一切都是错的!

所以,Michael Abrash,被 Mike 请上台的 Oculus 的首席科学家将会在下面用各种例子告诉你:“为什么,虚拟现实对你会非常重要,而迟早,你也会被 VR 所吸纳。”

虚拟现实这个概念,在上个世纪已经被埋葬过了。它被称之为是无法实现的科学幻想,以及让人头昏眼花的科学笑话。但也许,这就是所谓的赶得早不如赶得巧,而现在,大家又开始重新关注 VR 了。不过,Abrash 对于 VR 系统化的思考,还是从『雪崩』以及『玩家一号』这两本科幻小说开始的。『雪崩』让 Abrash 明白虚拟世界的可行性,而『玩家一号』则让大家看到了 VR 能成为什么样子。

这些科幻小说给了 Abrash 一个思考的框架,但,『黑客帝国』系列电影则让他真正的理解了虚拟现实的意义和重要性。

答案,就在墨菲斯的那句世界名言里:

matrix_effect

这句话,就能让你知道为什么 VR 不仅仅是非常有意思,而且还能改变世界 – 以及迟早,你也得参与其中。

那么接下来细细说明这句话的含义:

多数人,关注的都在虚拟现实的“虚拟”二字上,意思就是针对人的各个感官系统打造的各项信号系统。但实际上,真正应该关注的是“现实”二字。墨菲斯的名言则几乎就是虚拟现实意义的核心主旨所在。

我们的意识,或者称之为“灵魂”,从未和真正的现实(如果存在)进行过交流,实际上,我们一直在交流的,不过是眼耳鼻舌身意对应的大脑部位而已。

michael-abrash-fivesenses

我们永远不知道,真实的世界在经过我们的感官系统过滤之前是什么样子 – 而且这些感官感知到的也不过是真实世界中非常小的一部分。

就拿我们感知系统最发达的一部分 – 视觉来说吧,我们看不见红外紫外X外线,我们只有三原色的感觉系统,真正的高分辨率部分的可视角度只有2°左右和一个拇指指甲大小差不多,我们每只眼都有一个盲点,除了焦点以外其它都是模糊的……

michael-abrash-vision

但即便我们能以360°的角度非常完整精确地记录每一个到达我们眼部的光子,我们依然没有办法建立一个正确的世界框架。

比如前段时间非常著名的蓝黑白金裙子,其中的图像实际颜色和周围环境暗示的颜色有着非常大的差距。而每个人对于暗示和实际的感知都有不同。不过这不是最主要的,最主要的在于,你可以看到在这场席卷全球互联网的争议之中,所有人都对自己的感知正确性深信不疑。

所以,我们可以再回头看看墨菲斯那句话的定义部分:真实不过是大脑给你的电子信号而已。

我们是如何通过如此有限的信息感知世界的呢?基本上,我们已经有了一个关于这个世界的静态模型,然后不停地根据外在信息来更新它而正是这个模型,才是你的世界,以及你感知到的一切

我们感受到的并不是这个世界,而是这个世界的模型,我们本身不过是一个感受器而已。

optical-illusion-09

比如说这个窗户幻觉,在这个场景里,这个窗户上的一些细节暗示了你的大脑,导致你的大脑短路从而产生了一种并不符合实际的感知,你的视觉系统会认为窗户转动一半以后又转了回来。由于这和现实相悖,因此你看到了一个不可能的场景。

optical-illusion-01

墨菲斯问过所有人一个问题,你想要红色药丸还是蓝色药丸?

optical-illusion-02

但实际上,你把一切挡住,会发现无论红蓝,都是一样。

optical-illusion-03

左边魔方里的蓝色和右边魔方里的黄色也是一样。这两个例子告诉我们:现实中多数时候的颜色都是由我们的感知系统凭空捏造出来的,而且其捏造程度远远超出你的想象。

optical-illusion-04

这是更极端的例子,大脑的脑补能力能把真实的颜色完全反过来。

也许你会说,这些都是颜色而已,这个世界上还有色盲呢……那么,形状呢?

optical-illusion-06

这些都是正常的横平竖直的形状,对吗?但我们只要简单地在上面加一些点……

optical-illusion-05

如果你不相信这个图和上面的方块一样是横平竖直的,可以用任何直的东西量一下。这个幻觉产生的原因是你的大脑会根据对比来判断方向,而这些在方块角落上的点正是利用这一点来让你的大脑产生方向偏差的幻觉。这是一个二维下的形状的例子,如果在三维下又会怎样呢?

optical-illusion-07

左边的桌子明显看起来瘦长,右边的宽短。但实际上,这两个桌子的面积完全一样。在三维世界中,一个二维的面积大小取决于各种因素,你的大脑会自动调整。这种调整在这里是错的,但一般来说更有利于我们在三维世界的行动。

形状完了……运动又如何呢?也许你认为,观察运动一定是基于对于现实的反馈吧。

optical-illusion-08

看看左边,然后用余光看右边,注意点的转动方向。接下来看看右边,用余光看左边,注意点的转动方向。你再来回试试看?

这个的原理是基于你的眼睛的感知系统 – 你的余光分辨率很低,只能注意到高对比,也就是黑色的部分,而黑色的部分恰好以符合逆时针的方向闪烁,于是在你的余光里,就会认为点在往逆时针方向转动。

而下面这个则是简易的人脸识别系统,能自动追踪观测者的脸……

optical-illusion-10

更离谱的是声音。下面这个 McGurk 效应告诉我们,连声音都是经过了我们大脑修正了的。我们听到的会被我们看到的东西所影响 – 眼见不一定为实,耳听更有可能就是虚的。

所以,我们认为的现实,不过是幻觉而已 – 一个经过了千万年进化锤炼、能让人自如地在这个危险世界里生存繁衍的精致幻觉。这些例子告诉我们,一旦给予了我们合适的信息,即便从理性上我们知道真正的“现实”是怎样的,我们也很难去选择感受到的一切。

这样,就让某些情况额外突出了 – 就是那些我们能选择的现实:

michael-abrash-cube

我们可以选择到底是从斜上方看到的还是从斜下方看到的这个方块。

斯坦福大学虚拟互动实验室创始人 Jeremy Bailenson 说过:“所有的现实都是虚拟的。”

这就让我们回到了虚拟现实这个话题上,以及这项技术为什么和之前所有的技术有那么大不同 – VR 是让你真实地去体验一个虚拟的世界,而上面这些例子告诉我们的就是,一个体验是否真实,完全由你的感官系统决定。你的感官系统会自动为你做出判断,无论你觉得自己有多理性,多“聪明”。

也就是说,当虚拟现实做得足够好,就是现实。

而这些例子从另一个角度也告诉我们,我们无需完美地复制出现实(现在也做不到),就能让你感觉真的去到了另一个世界。

比如说,新月湾里的画面是每秒90帧的速度传到你的眼睛里,而现实世界的画面当然是连续的。如果把速度降到60,有些人就会感觉到闪烁;降到10,所有人都能知道这是假的。新月湾的显示和现实世界的呈现方式差异很大,但只需要满足人们大脑的输入要求,就能达到临在感的效果。

michael-abrash-differences

而对于输入的要求,最重要的一点就是反馈。比如,在新月湾的某个演示中,当你站在某个摩天大楼楼顶边缘时,没有人敢往前踏一步。而如果你看的是大屏幕上的视频时,无论多高,没有人需要说要找个扶手。

差别在于,当你在新月湾原型机中,稍微转动脑袋,你专门感受运动的前庭器官,对应上了视觉上的平移视差,完全符合了你对于这个世界的认知模型。当这些对应关系的延迟足够低(20毫秒以内)时,你的大脑就混乱了,将这些虚拟的人造信号认知为真实世界的一部分。这就是虚拟现实和之前所有媒介的最大不同之处。

VR 的关键就是直接 Hack 我们所有的感知系统,造出另一个现实来接管所谓的“现实”对我们的控制。

这意味着,真正的虚拟现实,不仅仅能创造出目前世界上所有可能有的体验(比如山上攀岩、在水里游泳),更能创造出在人的感知范围内有能力经历的一切体验(比如在奇幻世界里飞行)。真正地带你飞。

当然,有很多事情今天是做不到的……今天的消费级技术连在虚拟世界中看到自己的身体都有困难。但同时,这也是最让人激动人心的点 – 虚拟现实有太多可以让人来设计,来优化的地方了。

比如说,力反馈。我们希望在虚拟世界中看到自己的手,更希望能和虚拟世界互动,能摸到虚拟世界里的物品。而现在的游戏手柄,显然没有办法提供这种体验。但虚拟世界中的手和现实世界中的手的使用差距,并没有多数人想的那么遥远。

比如说,视觉。可视角度、像素密度、动态范围、图像质量、可变焦距都有非常大的上升空间,而伴随着这些参数的改进,工业设计和体积也会得到升级。这些上升空间有多大呢?假设我们希望新月湾的显示质量和你桌子上在正常视距下的普通显示器一样,那么新月湾的单眼分辨率至少要到5k×5k,比目前新月湾的像素大概多上20倍左右(小猜测:5000×5000/20=1,250,000 ;1200×1080=1,296,000)。蛤?你问要到retina@180°级别?16k×16k(200倍)……

声音好很多了,不需要太多的硬件更新,只需要更多的运算量和算法迭代。

跟踪也会是重要的一环,尤其是跟踪人体,如果需要将你的表情映射到虚拟现实中的角色身上,让他人看见,那么这意味着跟踪必须要可以捕捉到眼部、嘴巴乃至脸部肌肉的抽动。

而这些技术的每一部分,都要求人们对对应人体的每一部分如何工作有更深层次的了解,而现在的程度还远远不够。

那为什么,Abrash 认为这一次 VR 会复苏呢?

首先是马上要发布的消费者版的,已经足够吸引人了,能够带来以往任何设备都带不来的体验。每一个没有预设的人,带上这个设备都会兴奋得疯掉。

其次是行业的推进:Abrash 列举现在已经公开的四大家:Oculus、Sony、三星、HTC,不算那些暗流涌动秘密研发的公司,光是这几家已经可以让大家认识到这股潮流背后的推力有多大。

第三点是长期的推进承诺,在 Facebook 的收购之后,VR 的地位已经可以被确保,这么大的赌注一旦下去,没有人能够撤回来。

最后一点则是技术的演进速度。 Abrash 拿自己的第一台电脑(没有浮点计算能力),和 nV 刚刚发布的 TitanX 浮点计算能力作比较,33年的提升大概是10亿倍。这就是在竞争和需求的情况下,技术演进的速度。这,也会是 VR 的未来。

michael-abrash-course

下一个平台是什么?对于我们来说,VR 可能不仅仅只是下一个平台,因为它能创造出所有的人类体验,它可能就是人类的终点。当然,现在还有很多碎片没有拼合上:没人知道应该如何解决在虚拟现实中的移动问题,没人有完美的输入方案,更不要说 VR 电影、社交方式以及人们想在 VR 中玩的游戏了。但这些,迟早都会解决,在这个过程中留给大家的就是各种机会。我们都有可能成为 VR 大潮中的一部分 – 而我们每个人要思考的就是,到底在何时加入到这股永生难忘的浪潮中?也许你希望成为领导者,推广者;也许你希望等到这个技术成熟以后。但 VR 有着改变世界的潜力,且奇酷无比。因此,早晚你都会来到我们的身边。

vrerse


人脸识别跟踪龙下载:PDF

Source:F8Live

3 COMMENTS

LEAVE A REPLY

Please enter your comment!
Please enter your name here