您现在的位置是:首页 >技术交流 >【原汁原味的采访底稿】LiveVideoStack专访:老鹿,在路上网站首页技术交流
【原汁原味的采访底稿】LiveVideoStack专访:老鹿,在路上
PART 1 (个人经历)
1.陆其明老师您好,为我们做个简单的自我介绍吧!
我是一名从PC互联网时代走过来的老兵。2000年开始工作,所以工龄超级好算。至今工作过5家公司。自从第一家公司开始做数字视频监控系统以来,与音视频结下了不解之缘。之后每家公司都没离开过多媒体领域。整个职业生涯大致分为三段吧:第一个10年在外企,写代码,学技术,带团队,体验国际文化,积累各种项目经验,写博客,出书,与技术社区紧密互动;第二个10年在国内互联网公司,一路“小步快跑”、快速迭代,见证了PC互联网的衰落、以及移动互联网的蓬勃发展,经历公司合并、上市,工作有压力,同时也有满满的成就感,因为我们的每一次功能迭代或优化影响的是几千万日活用户;现在在一家智能终端解决方案公司,企业在转型过程中,我也正开启自己的第三个10年奋斗……
2.对一些技术人/程序员来说,您出版&翻译的书籍对他们的职业选择和发展产生了影响。那么,写书/翻译书籍为您带来了哪些影响?其中最让您意想不到的是什么?
很高兴我的书给一些人带来了正向的影响。有些朋友告诉我,他们是看了我的书,才入这一行的。作为技术人,我觉得个人能力成长是非常重要的;项目再忙,别忘了个人成长!除此之外,建立个人品牌同样重要。写博客、出书、授课、发起开源项目等等,都是极好的个人品牌建设途径。当你有一天小有名气的时候,来到一个新的环境,你不必过多地介绍自己,或者费力地证明自己,大家知道你是谁(以及你的公开成果),起步就多几分尊重,更便于你融入团队、推进工作。这在我职业生涯的第二个10年里感受比较深。也算是意外之喜吧。因为我最早开始写博客时,纯粹是个人技术总结和分享,后面发生的事情谁也想不到。
3.您曾经连任4次微软MVP,这背后您付出了哪些努力?
第一次获得MVP殊荣大概是在20年前的事了。那时候写了很多有关多媒体开发技术的文章,也出了第一本书《DirectShow开发指南》,因为用的都是微软技术,我在技术社区起到的推动作用获得了微软的认可。那几年在技术社区还是很活跃的,有比较多的输出,因此也连任了几届MVP。我对微软MVP计划一直是心存感激的,因为这个计划,我生平第一次出国(去了新加坡),还结识了至今都有联系的其他MVP朋友们。
4.在您长达二十几年的职业生涯中,您所参与的最难忘的项目是什么?
20几年里大大小小做过很多项目,最难忘的必须跟人有关。那是在外企的时候,时值HDDVD与BD标准之争,在胜负未见分晓时,当时我们公司的策略是两个标准都做,这样不管最后哪个标准赢了,我们公司都不会输。我带的团队参与HDDVD项目,做了很多研究和开发工作,但都没有在正式产品里落地过。突然有一天,团队里的一位小伙伴跑过来跟我说,他要离职。问他离职原因,他说我们项目开发没有节奏感…… 这位小伙伴技术不错,平时相处也挺融洽的,我真是难以理解他要的节奏感究竟是什么。随后几年,Scrum敏捷开发流程快速发展起来,经过一段时间实践,我才渐渐理解了他。后来我进入国内互联网公司,为团队做的第一件事,就是导入Scrum流程。
5.近几年您遇到的最大的困难是什么,以及您是如何坚持下来的?
在大厂里,有很多很多团队,大家分工不同,相对固化。我是做PC客户端的,专注的是Windows技术,做了很多年。但随着PC时代的终结、移动互联网大行其道,移动端App技术日新月异,但与我无关;AI再炙手可热,跟我关系也不大。倍感失落!自己擅长的平台和技术日渐过时,而团队负责的业务又在每况愈下,作为一名二线管理者,上不上下不下,身处在一个“不进则退”的环境里,那种焦虑和彷徨是非常难熬的。有时候,解决困难的办法不是坚持,而是跳出来。
6.在您的技术进阶之路上,给您启发最大的是谁?
第一个10年里技术成长最快,基本上都是跟着直属领导学,或者向CTO看齐,所以也不必说是谁谁谁。我很幸运,碰到了很多好领导,他们的为人处事,他们对于技术纯粹的热爱、对极致性能体验的孜孜以求,时时都在鼓舞着我。如果你正在走上领导岗位,请务必以身作则,做一位对团队成长有帮助的好领导。
PART2(专业经历)
7.您在2022年加入瑞声科技,如今已经一年有余,为什么会选择加入瑞声科技?您能描述一下作为开发总监的职责吗?
加入瑞声科技算是机缘巧合。从互联网公司到智能终端解决方案公司,跨度很大,一般人是很难理解的。坦率地说,这个变化背后一方面是受经济大环境的影响,另一方面是我个人技术困境的破局(前文已有提及)。瑞声科技虽然起家的时候更多是在做硬件方面的产品,但现在已经转型成为一家可以为智能终端提供软硬件一体化解决方案的科技公司,我在这里仍然负责软件开发,平台覆盖Windows、macOS、Android和iOS,涉及的技术面很广,包括原生开发、跨平台框架、H5、小程序、游戏引擎等等,一下子束缚全无,有了“海阔凭鱼跃”的感觉!我们在开发一款叫RichTap Creator的触感设计工具套件,能够让设计师创作出各种富有表现力的振动效果,我们还有强大的算法为音视频自动适配,还有多平台SDK,让开发者轻轻松松就能在自己的App里集成丰富的触感。我们提供的是从硬件到软件,从设计、集成到应用的全链路解决方案。欢迎访问我们的官网https://www.richtap-haptics.com/ 获取更多信息。
8.在瑞声科技的一年里,您对音视频技术又有了哪些新的理解?
之前的工作经历都在软件领域,对音视频技术的理解有些狭隘,来到一家很“硬科技”的公司之后才意识到,其实基础的元器件也很重要。硬件是经济基础,软件是上层建筑。硬件提供能力,软件把硬件能力充分发挥出来,才能给用户带来极致体验。
在过去的一年里,我还认识到,音视频技术比较孤单,是时候给他俩介绍一位新伙伴了——我们把绚丽的视频献给眼睛,我们把美妙的音频献给耳朵,那我们的双手或身体的其他部位呢?我们可以给它们带来触感体验。触感是由一颗小小的马达产生的,近两年来,每年上市的中高端手机里60%以上都搭载了瑞声科技的高品质X轴线性马达。别让它们沉睡太久!
9.作为国内最早一批从事流媒体的从业者,您是怎样看待这十几年流媒体的蓬勃发展的?
我刚开始工作时,主要还是在PC单机上处理多媒体,包括音视频的编辑、转码、播放和存储。那时候多媒体格式还是MPEG-1、MPEG-2、AVI……一些门户网站上发布的视频是需要先下载、再本地播放的,我有个移动硬盘,至今还保留着很多那个年代下载的搞笑小视频,还有很多MP3。随着网络基础设施的升级,音视频编解码技术以及网络传输技术的进步,如今流媒体技术已经应用得非常广泛了,场景非常多,比如在爱奇艺看个影视剧、在微信/抖音刷短视频、在线音乐、秀场直播、电商直播、游戏直播、在线视频会议、云游戏等等。其实归纳起来就两种技术形态:点播和直播。开源社区的助力又让技术应用变得门槛很低。场景带来需求,推动技术进步;技术进步了,又会赋能更多场景。相互促进,才有了如今流媒体的蓬勃发展。当然,疫情这三年,很多人不得不在家办公,或者把一些不是很必要的线下会面改成线上,对流媒体应用也是一次不小的助推。
10.您近期比较关注的技术或行业趋势是什么?(越详细越好)
近一年我比较关注的是沉浸体验。音视频体验应该还是往更高清、更沉浸的方向发展。只是可能很多人还没认识到,沉浸体验未必非得在音视频上继续“挖呀挖”。我们还可以通过触感来让体验更加沉浸。答案在问题之外……
在前面我已经提到,市场上已经有越来越多的手机搭载高品质的X轴线性马达,可以表达丰富的振动效果。怎么把这块能力用起来?需要应用开发者们一起努力!据悉,IEEE针对手游场景下的触感控制接口标准正在紧锣密鼓地制定中。
除了手机,AR/VR设备更是触感体验大展拳脚的地方。我看过各家VR一体机的SDK,大家提供的振动接口功能还比较初级。同时看了OpenXR 1.0规范,感觉也不尽如人意。我们公司正在与一个触感行业协会合作,一起推动OpenXR标准进化,让更多的VR可穿戴外设如背心、手套等能够协同工作,为用户带来更加沉浸的体验。
我还注意到MPEG标准工作组在这个方向上的努力,关于沉浸体验的标准叫MPEG-I,注意是字母I,代表immersive。千万别把它看成是数字1哦,要不然就是个大乌龙!以后,一个MP4文件包含的可能不仅是音频或视频数据,还有触感数据。甚至可能只有触感数据,因为在2022年1月 ISO/IEC 14496-12 (ISOBMFF) 标准-第7版已经把haptics定为一级媒体类型,与audio和video平起平坐。这个动向非常值得大家关注!
11.您现阶段正在解决的问题以及您下一个阶段的研发目标是什么?
我的目标分两方面:一方面要提升大家对触感/振动的认知,另一方面要让设计触感和应用集成的难度降到最低。简单来说就是回答两个问题:触感是什么?怎么做?我们开发了专业的RichTap Creator桌面端设计软件,设计师可以很方便地设计出各种振动效果,可以连上手机实时体验;导出振动效果文件之后,在应用端集成,通过RichTap SDK轻松播放和控制——真正做到:一次设计,多端落地。目前这套工具链是完备的。我们下一阶段的目标是要支持双马达甚至多马达的场景。我知道我们一个品牌客户有一款平板是搭载双马达的,如果把它们发挥好,振感可以更加立体、丰富,在这台平板上玩游戏不要太爽哦!
除了手机/平板之外,AR/VR/游戏手柄/新能源车都是我们密切关注的落地场景。我们会提供全套的设计工具和集成SDK。从研发的角度,我还会持续关注触感相关的国际标准,让我们的工具和SDK能够紧跟国际大趋势,在全世界范围内做到最好!
12.目前多媒体圈正面临减速、内卷、就业艰难的局面,您怎么理解当下的局面?您怎么判断多媒体生态的未来?您对当下的从业者有什么建议?
前面已经谈到,流媒体的蓬勃发展是应用场景和音视频技术交替进步带来的。当场景差不多挖掘完了,技术没有大的突破时,大家就只能开始原地“卷”了!比如云游戏,用户端延迟已经做到了20ms,继续加大投入把延迟降低到10ms的收益就没那么大了吧?!真正决定云游戏业务成败的关键并不是开播延迟。我们还是要去思考业务的真正痛点是什么,然后再去投入。至于多媒体生态的未来,我觉得元宇宙是一个很有希望的方向,这里面会涉及到很多技术,只是谁也不知道相关的软硬件技术和基础设施会在什么时候成熟,元宇宙会在什么时候真正到来。做技术的,始终不要忘了创新和优化,尝试使用新技术,探索新的用户场景,努力去创造价值。只不过,创新不是在指定时间、指定地点发生的事情,需要多一点耐心。
PART3(大会相关)
13.为什么选择了触感作为本次大会的演讲主题?在您眼里,人类的哪种体验,最接近您心中的沉浸式体验?
之所以要讲触感,是因为经过一年多的学习和研究,我意识到触感的软硬件技术正在逐渐成熟,而大家对触感的认知还比较浅,应用生态的发展还远远不够。从应用的角度,爱奇艺可以说是走在前面的,几部热剧比如《天才基本法》、《狂飙》,还有综艺节目《中国说唱巅峰对决》,都开启了振动功能,起到了很好的渲染剧情气氛、加强现场感的作用。还有几款游戏,比如《和平精英》、《黎明觉醒》、《王者竞速》等,在一些场景中,赛车漂移、骑摩托车、开枪、撞击、脚步声等,融入振动后让玩家体验更逼真、更沉浸。然而,仅有这些头部应用还是不够的,我希望通过我在本次大会上的分享,提升大家对于触感的认知,进而共同来繁荣触感生态。触感不仅可以用在手机上,在AR/VR乃至元宇宙里有更大的发挥空间,那种场景下更加追求沉浸式的体验。2018年有部电影叫《头号玩家》,它讲的故事比较符合我对元宇宙的想象。只不过现在的VR设备在佩戴的舒适度上还有很大的提升空间,感知体验还有局限,还有比较长的路要走。
14.提到触感技术,我们现在的感受局限在“五感”中,真正的虚拟现实场景和沉浸逼真的触感体验还有多久才能实现?
五感是形、声、闻、味、触,分别对应人的五种感觉器官:视觉、听觉、嗅觉、味觉、触觉。五感中发展得最成熟的无疑是视听,而我觉得接下来就应该是触感了。我看到有一些公司在做嗅觉和味觉的模拟,但离成熟应用可能还需要一定的时间。元宇宙离不开这些感知技术的成熟应用。我个人是很期待的!
15. 能透露一下您在这次在LiveVideoStackCon 2023上海站会带来哪些独家内容吗?
在LiveVideoStack大会上,应该还从来没人讲过触感吧。在上海站,我会给大家科普触觉的生理基础知识,以及触感在现实中的实现技术(包括硬件和软件)。我会给大家介绍触感应用生态的现状,会从应用开发的角度给大家展示在各个平台怎么去做触感,以及如何才能做到更好的体验。我还会介绍触感相关的国际标准及其最新进展,希望帮助大家拓展视野,为未来的工作找到一些方向。
16.陆老师也是从第一届就开始支持我们大会了,您与LiveVideoStack也结缘已久。您觉得这六年来,LiveVideoStack有怎样的成长呢?
音视频本就是一个非常专业的领域,门槛高,从业者少,但大家交流的需求是客观存在的。就如小范围的朋友聚会,总要有人召集,大家除了吃饭,总要聊一些话题。LiveVideoStack就是音视频圈内聚会的召集者和组织者,为大家搭平台,促进信息流通,推动行业进步。这是一件需要情怀、而且很有意义的事情,LiveVideoStack坚持做了六年,不断输出高品质的内容,已经在行业内形成了良好口碑!每年都会有朋友或同事过来问我要打折门票(凭我这张老脸问包老板讨的),说明这个大会有用,真的能帮到大家。我很荣幸第一届大会就参与了,那年是做专题出品人。今年我会以讲师的身份上台分享。继续支持LiveVideoStack!相信一定会越办越好!