Sora王炸团队揭秘,新生力量崛起:应届博士“牵头”,4位华人及00后加入
Sora王炸团队揭秘,新生力量崛起:应届博士“牵头”,4位华人及00后加入

Sora王炸团队揭秘,新生力量崛起:应届博士“牵头”,4位华人及00后加入

Author
Created
Feb 24, 2024 05:29 AM
Tags
Type
文章
Date
Feb 24, 2024
Content
media
https://mp.weixin.qq.com/s/qL2KD225ItonmrYoYNrgYg
龙年伊始,Sora就像是一颗炸弹,迅速引爆全球。
 
OpenAI发布文生视频模型的Sora可以根据自然语言生成电影大片质感的60秒短视频,其中既能实现多角度镜头的自然切换,还包含复杂的场景和生动的角色表情,且故事的逻辑性和连贯性极佳。360董事长周鸿祎说,它意味着AGI(人工通用智能)的实现将从10年缩短到两三年。
 
在今天的数字化浪潮中,Sora的技术团队凭借其创新性研究和年轻化的团队结构,迅速成为业内外瞩目的焦点。这个团队不仅因其项目主管在社交媒体上的高关注度而成为热门话题,而且成员们的个人成就和多才多艺的背景也在持续吸引公众的关注。
 
13人天才团队,
博士应届毕业生与印度裔小伙“牵头”
 
Sora团队的成员来自世界顶级的教育和研究机构,他们不仅在人工智能领域有着深厚的研究基础,还展现出了多方面的才华。根据Sora官网公布的信息,我们可以看到Sora的作者一共有13位。
 
notion image
Sora代表成员
 
Tim Brooks
Tim Brooks在OpenAI共同领导了Sora项目,他的研究重点是开发能模拟现实世界的大型生成模型。
 
notion image
Tim Brooks履历
 
Tim本科就读于卡内基梅隆大学,主修逻辑与计算,辅修计算机科学,期间在Facebook软件工程部门实习了四个月。
 
2017年,本科毕业的Tim先到Google工作了近两年,在Pixel手机部门中研究AI相机,之后到了伯克利AI实验室攻读博士。在伯克利读博期间,Tim的主要研究方向就是图片与视频生成,他还在英伟达实习并主导了一项关于视频生成的研究。
 
回到校园后,Tim与导师Alexei Efros教授和同小组博士后Aleksander Holynski(目前就职谷歌)一起研制了AI图片编辑工InstructPix2Pix,并入选CVPR 2023 Highlight。
 
去年一月,Tim顺利毕业并取得了博士学位,转而加入0penAI,并相继参与了DALL-E 3和Sora的工作。值得一提的是,Tim不仅在专业领域拥有高超的技术水平,还是个多才多艺的人。
 
据Tim自己介绍,他还喜欢摄影和音乐,高中时他拍摄的照片获得过National Geoqraphic颁发的奖项,本人到过百老汇演出,还获得过B-box国际奖项。
 
notion image
Tim Brooks的摄影作品
 
Bill Peebles
与Tim师出同门、晚毕业4个月的Wiliam Peebles,也是Sora的另一名负责人,专注于视频生成和世界模拟技术的开发。
 
notion image
Bill Peebles
 
Bill Peebles本科就读于MIT,主修计算机科学,参加了GAN和text2video的研究,还在英伟达深度学习与自动驾驶团队实习,研究计算机视觉。
 
毕业后正式开始读博之前,他还参加了Adobe的暑期实习,研究的依然是GAN。在FAIR实习期间,和现NYU华人教授谢赛宁合作,研发出了Sora的技术基础之-DiT(扩散Transformer)。论文还曾入围CVPR2022最佳论文候选。
 
notion image
GAN生成对抗网络的应用
 
Aditaya Ramesh
Aditaya Ramesh是DALL·E 创始人。DALL·E也是OpenAI旗下产品,这项产品根据文字生成图片,它的出现一度让绘画和设计行业感到惶恐。
 
notion image
Aditaya Ramesh
 
Aditaya本科就读于纽约大学,并在实验室参与过一些项目。其间,Aditaya就已经在研究生成式模型,并共同发表论文。毕业之后,Aditaya本想继续深造,但在OpenAI的暑期实习中被留了下来,成为了正式研究人员。
 
4位华人在列,还有高中就在创业的00后
 
Sora团队选择这个名字,寓意着“无限创造潜力”,这不仅反映了他们对技术的追求,也展现了团队年轻、充满活力的精神。他们的工作,尤其是在人工智能图像和视频生成领域的突破,预示着这个团队将在未来的技术革新中扮演重要角色。Sora团队的年轻化特点,团队成员涵盖了刚刚博士毕业的研究者以及00后的年轻才俊,这种跨年龄段的合作模式为创新研究提供了新鲜血液,也使得团队充满活力和创新精神。
 
根据技术报告提供的姓名,从名字上看,其中有4位是华人,分别是Yufei Guo(郭雨菲)、Li Jing(李静)、Clarence Wing Yin Ng、Ricky Wang(王瑞奇)。
 
其中,Li Jing2014年毕业于北京大学,2014-2019年期间在麻省理工深造,拿到博士学位。
 
notion image
Li Jing领英页面
 
后来继续在Facebook AI Research(研究院)念博士后,于2022年加入OpenAI。
notion image
 
Ricky Wang是90后,高中就读于南京师范大学附属中学(2010年-2013年),2016年本科毕业于UC伯克利,于今年1月入职OpenAI。
 
notion image
Ricky Wang领英页面
 
另外两位Clarence Wing Yin Ng、Yufei Guo(郭雨菲),尚未了解到公开信息。
值得一提的是,团队还有一位2003年出生小伙Will DePue。
 
notion image
Will DePue
 
Will DePue高中就读于Geffen Academy at UCLA,这是一所大学附属中学,招收 6 至 12 年级的学生。在12年级最后一年(相当于国内高三),Will DePue在疫情期间创立了自己的公司DeepResearch ,后被Commsor收购。
 
2021年,Will DePue毕业于密歇根大学,获CS专业学士学位。2023年7月,他加入OpenAI。根据领英信息,他是在今年1月才刚刚加入Sora项目组。
 
notion image
 
另外,这13人创始团队并非各个毕业于传统意义上的顶尖名校,比如Connor Holmes毕业于Colorado School of Mines(科罗拉多矿业大学);David Schnurr毕业于UCSB(加州大学圣巴巴拉分校);Joe Taylor毕业于Academy of Art University(美国旧金山艺术大学)。
 
其中,Joe Taylor在美国旧金山艺术大学就读的是新媒体和计算机艺术专业。可见,Sora并非全是技术大佬,是一个具有多样性背景的年轻团队。
 
Sora的兴起,革新科技革命
 
Sora团队的崛起,不仅展现了OpenAI在人工智能领域的领先地位,也为整个科技界带来了新的灵感和动力。
 
2022年末,OpenAI聊天机器人ChatGPT的面世无疑成为了引领人工智能浪潮的标志性事件,宣告了新一轮科技革命的到来。无论是聊天娱乐、教育学习,还是工作生产、医疗健康等领域,人工智能正以前所未有的速度渗透到我们生活的方方面面。而OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。
 
随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。
 
视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。
 
notion image
Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。
 
对于OpenAI视频生成模型的出现,业内其实早有预期,但仍有人评价称“比想象中来得更快”,亦有人振奋地表示“我们真的看到新工业革命来临”。
 
2月16日,业内分析人士表示,Sora无疑是人工智能领域的一次重大突破,该技术不仅展示了AI在理解和创造复杂视觉内容方面的先进能力,而且对内容创作、娱乐和影视制作行业带来了前所未有的挑战和机遇。
 
如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。
 
notion image
Sora在技术驱动社会进步的历程中扮演着多维度的角色。它不仅是技术创新的典范,更是推动社会发展、探索人类与环境互动新方式的关键力量。通过Sora,我们可以预见到一个更加智能、互联的世界,其中技术和人类社会能够更加和谐地共存和发展。
 
而Sora团队的故事,是关于才华、创新和合作的故事。随着这个团队继续推动技术的边界,他们的工作无疑将为我们带来更多令人兴奋的技术突破。在探索未知的旅程中,Sora团队正成为引领未来的一股新力量。
 
资料来源:正和岛、新智元、AI探秘式、科技备忘录
 
原文章作者链接