「科普大佬说」以计算机图形学的视点看元宇宙发展
5月23日,由智谱AI支持,北京市科委、中关村管委会科普专项经费资助的系列栏目“科普大佬说”首期于AI TIME 开讲,本次讲座邀请了来自中国科学院计算技术研究所的副研究员高林老师,主要内容为通过回顾历史来展望未来——由计算机图形学的历史来展望元宇宙的未来。 计算机图形学 计算机图形学是利用计算机研究图形表示、生成、处理和显示的学科,是计算机科学中最为活跃、应用最广的分支之一。
计算机图形学应用场景 计算机图形学深深地影响了我们的生活。如今大火的“元宇宙”概念,同样是以图形学技术为基础而发展至今的。
计算机图形学发展历史
我们发现,研究图形学的历史可以从计算的历史来入手,早在计算机之前就已经有了计算器。而等到现代意义的电子管、晶体管计算机出现后,人们则开始使用打孔卡来进行计算器输入。在交互方面,SketchPad光笔交互矢量显示的出现则为我们展示了新的思路。计算机图形学的研究范畴不仅包括通过计算机将图形计算和显示出来,其中最重要的一点是理解人并与其交互。在工业发展中,需要大量的图纸从二维的平面将物体画出来。这个步骤需要设计师大量的想象能力,而如果交给计算机就会事半功倍。在三维层面完成的维度修改,不仅方便工程师去设计,也极大地提高了生产效率。由此可见,几何建模也是计算机发展历程中很重要的部分,具有着划时代的意义。 然而,仅仅有线条也是不够的,我们还需要有模型。我们需要营造立体感,而这些立体感的营造是需要算法实现的。毕竟,推动科学前进的重要因素还是科学家们的科研成果。这里就不得不提到SIGGRAPH社区,该社区的历史可以追溯到1967年,因举办SIGGRAPH会议而享誉于世。在最早的计算机时代,交互方式对使用者非常不友好,一度只能由专业程序员来使用计算机。这一现象直到施乐公司提出图形用户界面GUI的概念才最终画上了句号。图形学在有了用户界面之后也是发展突飞猛进,应用范围也在变得越来越广。 2019年,Ed Catmull获得了图灵奖。他的代表工作就是对网格进行细分建模并进行纹理贴图,进行真实的三维渲染。我们可以看出,图形学的发展同时也是和工业、商业紧密结合的。提到商业,我们就要提到一些和图形学联系紧密的投资家。
施乐公司最早提出了图形界面,之后乔布斯和苹果公司进一步研发了带有图形用户界面的个人电脑,极大的推广了计算机的应用范围。人们在不使用命令行的情况下也可以使用计算机,这也拓展了图形学的应用范围。科学家们同时在思考,能否用计算机建造出三维模型呢?他们希望能够通过计算机将当前所有的已知物体渲染出来。贝尔实验室的科学家Turner Whitted提出了光线跟踪算法,成功的将三维模型渲染了出来,让真实物体也可以得到渲染。同时,硬件公司也开发了图形工作站,帮助人们高效的实现这些算法。康奈尔大学基于此开发了大量基于物理的渲染方法,这时已经可以将这些三维模型真实地渲染出来。
接下来,乔布斯发现后续可以继续利用图形学去做电影,便找了图形学专家Catmull一起投资了Pixar公司。Pat Hanrahan 开发了RenderMan引擎用于离线渲染。乔布斯便将这种技术应用到电影之上,通过结合图形学的技术开创了时代的先河。这里同时也使用了Catmull的网格细分建模技术,可见如今的电影也无一不是与图形学技术结合的结果。 在工业时代,图形学也起到了划时代的作用,尤其是CAD技术。波音777的设计完全是应用的CAD技术,这也为其省去了大量的图纸。波音777是第一款完全应用CAD技术生产出来的民用飞机。如今的汽车工业同样大量应用了CAD技术,而电影工业更是离不开图形学的技术。然而,运营图形工作站所需的条件是个人所不具备的,因此我们个人很难在最初接触到图形学的应用。独具慧眼的NVIDIA公司开发了首个图形处理单元GPU,这也标志着传统图形工作站的市场开始走向衰落。
进入21世纪,乔布斯再次展示了其优秀的才能,颠覆性地革新了交互模式。Iphone 2G这一款全触控交互手机的出现使得人们步入了图形学与人机交互的新纪元。图形学在如今科技的发展中依然扮演着极其重要的角色,2019图灵奖就是颁发给了图形学杰出学者Catmull和Hanrahan。 几何建模的意义 几何建模用于CAD/CAM系统中,高质量的几何建模结果,应用于科技生活的方方面面。
几何建模主要方法 基于几何造型的建模技术渲染 由专业人员通过专业软件等工具搭建出物体的三维模型。
利用激光三维扫描仪 能够自动构建出物体的三维模型,并且精度很高。
几何建模的发展历史
在几何建模领域,计算机辅助设计的研究对象从最初的Bezier曲线发展至后续的NURBS曲面。而在数字娱乐如电影、游戏中,离散的多边形网格也逐渐被广泛使用,这时就需要设计一些算法对这些多边形进行处理。另一方面,三维重建也在研究如何通过激光扫描仪建模真实的物理世界。在自动驾驶中,点云已成为当前的主要研究对象。 几何建模的展望
未来的几何建模应该是更具多样性的。我们试着展望未来,用户将能做到个性化地进行3D设计并完成三维打印。人们完全可以使用低成本的彩色相机进行三维建模,物理真实世界也会渐渐迈向数字化。 计算机图形学研究内容 渲染 数字几何建模后的模型,经过模拟光照、纹理、材质等信息处理,而得到视觉呈现的过程与结果。
渲染技术的应用 高质量的渲染,可以合成具有极高真实感的图像,在CG与电影行业、游戏行业有广泛的应用和深远的影响。
渲染的研究内容发展历史
渲染如果按照实时性区分,可以分为离线渲染和实时渲染。同时,渲染也有很多种方法。 传统图形学的渲染一定需要投影和透视等算法,并且要将其转换成像素,把散点模型转换成光栅。具体方法如下:(1)启发式方法:光照模型,效果快但是不真实;(2)光线跟踪算法:真实,但是效果慢; 因此,当前有大量的研究去提升光线跟踪的速度。微软公司更是推出了Direct X来做模型的加速。2018年,NVIDIA公司取得了一个重大突破——通过RTX硬件加速实现了实时光线跟踪。这样,游戏用户也能得到和观看电影同样的视觉效果。 渲染与新兴技术的结合 不得不说,AI技术尤其是深度学习的突飞猛进为我们的生活带来了日新月异的变化,同时很大助力了图形学的发展。
计算机图形学内容和意义 动画 通过计算机技术,模拟2D、3D模型的运动过程,应用于游戏的开发,电视动画制作,电影特技制作,生产过程及科研的模拟,增添多媒体的感官效果。
动画技术的分类 二维动画: 图像变形 形状混合 三维动画: 关键帧动画 变形物体的动画 过程动画 人体动画 智能体行为动画等…
动画技术的发展同样也是一个漫长的过程,由二维的关键帧动画变为三维也需要技术的突破。能否把人的动作传递给电影中的虚拟形象呢?这就诞生了动作捕捉技术,目前也在动画片中大量应用。 在未来数字世界之中,我们将很容易的建立虚拟人的形象,同样需要动画技术的辅助。 动画技术的发展历史
动画技术的未来 低成本虚拟人,驱动,视频虚拟人,粒子破碎,增强现实...
人机交互的发展历史
人机交互技术的应用范围
任何一种新交互技术的诞生,都会带来其新的应用人群、新的应用领域,并带来巨大的社会经济效益。 人机交互技术的研究内容 研究人与计算机系统之间自然高效信息交换的原理与技术,具体实现为由多种模态的输入输出软硬件接口所构成的用户终端界面,形成特定的交互模式。
人机交互技术的未来 集成化,智能化,标准化
计算机图形学的发展趋势 渲染更加真实化 光源、毛发、动作的新建模技术让渲染更真实 硬件的发展让渲染更快速
交互更加多样化
硬件更加小型化、低成本、低门槛
钱学森关于虚拟现实、灵境和元宇宙
元宇宙定义 一个平行于现实世界的虚拟世界 现实世界虚拟化、虚拟世界现实化 是下一代互联网,是人类未来的数字化生存
元宇宙前传:《雪崩》 元宇宙概念的提出: 1992年,Neal Stephenson的科幻小说《Snow Crash》中提出了“metaverse (元宇宙,汉译本译为“超元域”)”和 “化身(Avatar)”这两个概念。书中情节发生在一个现实人类通过VR设备与虚拟人共同生活在一个虚拟 空间的未来设定中。 《 Second Life》 :第一个现象级的虚拟世界,发布于2003年,拥有更强的世界编辑功能与发达的虚拟经济系统,吸引了大量企业与教育机构。 2021:元宇宙元年 2021年,可以被称为“元宇宙”元年。 “元宇宙”呈现超出想象的爆发力,其背后是相关“元宇宙”要素的“群聚效应”(Critical Mass),近似1995年互联网所经历的“群聚效应”。——朱嘉明 元宇宙的七层要素 元宇宙应用了大量的区块链技术进行去中心化,同时也离不开空间计算。图形学技术对UI、引擎等多方面发挥了重要的作用。
元宇宙的发展情况
元宇宙中的图形学 元宇宙基本要素:人、物和场景 数字内容创作的数量和质量决定了元宇宙体验的质量
基于动态纹理表达的数字人生成
核心思想 人体纹理特征同时包含静态外观信息和动态细节特征 神经网络易于拟合低频函数,增加数据流形复杂度有助于高频信号的学习
真实世界数字化-NeRFEditing
|
|||||||||||