百分网,一起奋斗一起拼搏。

当前位置:

首页

>

高考

>

正文

清华团队国产“Sora”火了 具体怎么回事

文/张雯2024/6/7 8:13:35

盛茂科技联盟清华大学发布视频模型“Vidu”,支持一键生成16秒高清视频,拥有多镜头语言、空间、时间一致性等优异性能,还可以创造出超现实的场景。该模型基于自主研发的U-ViT架构,通过大规模训练生成长视频,复用图文任务经验,提高训练效率。团队由清华背景组成,已获得数亿元融资。

清华团队国产“Sora”火了 具体怎么回事

清华团队火爆的国产《索拉》怎么了

4月27日,中关村论坛的未来人工智能在先锋论坛上,中国首个长期、高一致性、高动态视频模型Vidu正式发布。该模型包括清华大学与大型模型初创公司圣数科技联合发布,一键生成长达 16 秒的长度、1080P分辨率的高清视频内容。

证券时报记者独家获悉,清华大学人工智能研究院副院长、圣树科技首席科学家朱军在Vidu发布后发声:“维杜,我们的确是,我们做到了,我们一起做!感谢大家日日夜夜的坚持,实验室建筑成果丰硕。“据报道,这也是自 OpenAI 发布 Sora 以来,全球首个视频模型实现重大突破。

索拉被释放后,业界已有团队声称要赶超并重现Sora,Vidu团队花了两个月的时间才取得领先。记者整理发现,圣树科技在多模态大模型领域有着深厚的积累,也是多式联运大车型赛道估值最高的初创公司之一。公司迄今已完成三轮融资,融资金额达数亿元,投资者包括启明创投、智慧频谱AI、BV百度风险投资、金秋基金等机构。

其背后团队来自清华大学,已筹集数亿元人民币

维杜背后,圣树科技是清华大学明星创业公司。

公共信息展示,圣数科技成立于2023年3月,核心成员来自清华大学人工智能研究机构,致力于自主研发全球领先的可控多模态通用大模型。公司CEO拥有美国大学学士和硕士学位清华大学唐家宇 计算机系,清华大学首席科学家人工智能朱军 研究所副所长,CTO包凡是清华大学计算机科学系博士生、朱军教授研究团队成员,长期专注于扩散模型领域的研究。

今年三月,唐家瑜曾在沟通会上对媒体表示,该公司今年内的大型模型肯定会达到Sora当前版本的效果,“但很难说是三个月还是半年。”。然而,维杜提前交出了一份惊人的试卷,这主要得益于该团队是国内最早布局多式联运大型车型的团队之一,多年来,我们在该领域积累了丰富的经验。

据唐家瑜介绍,圣树科技目前采用模型层和应用层双向模型。一方面,构建覆盖文本、图像、视频、底层通用大模型,具有3D模型等多模态能力,为B端提供模型服务能力;另一方面,用于图像生成、打造视频生成等场景的垂直应用,根据订阅等收费,应用方向主要是游戏制作、影视后期制作等内容创作场景。

圣树科技自成立以来就备受资本关注。天眼查数据展示,圣数科技迄今已完成3轮融资。2023 年 6 月,完成近亿元天使轮融资,投资者包括蚂蚁集团、BV百度风险投资、卓远亚洲、卓远资本;2023 年 8 月,完成数千万元天使+轮融资,投资方为金秋基金;2024 年 3 月,完成数亿元A轮融资,启明创投以外的投资者、大泰资本、除了智普AI等新机构,还有BV百度创投、卓远亚洲两位老股东。

三轮融资数亿元资金支持,圣树科技已成为国内多式联运规模化模式中估值最高的初创公司之一。圣树科技快报,Vidu的出现不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证,也代表了盛树科技在多模态原生大模型领域的持续创新能力和领先地位。

© 百分网 17180.cn | 吉ICP备2022003481号-3