真·拿嘴做视频!Meta“AI导演”一句话搞定视频素材,网友:我已跟不上AI发展速度

首先,AI导演根据输入文本生成图像嵌入。真拿嘴
然后,视频视频素材速度解码器Dt生成16帧64×64的句话RGB图像。
插值网络↑F会对初步结果进行插值,搞定以达到理想帧率。网友
接着,已跟第一重超分网络会将画面的不上分辨率提高到256×256。第二重超分网络则继续优化,发展将画质进一步提升至768×768。AI导演
基于这样的真拿嘴原理,Make-A-Video不仅能根据文字生成视频,视频视频素材速度还具备了以下几种能力。句话
将静态图像转成视频:
根据前后两张图片生成一段视频:
根据原视频生成新视频:
刷新文本视频生成模型SOTA
其实,搞定Meta的网友Make-A-Video并不是文本生成视频(T2V)的首次尝试。
比如,清华大学和智源在今年早些时候就推出了他们自研的“一句话生成视频”AI:CogVideo,而且这是目前唯一一个开源的T2V模型。
更早之前,GODIVA和微软的“女娲”也都实现过根据文字描述生成视频。
不过这一次,Make-A-Video在生成质量上有明显的提升。
在MSR-VTT数据集上的实验结果显示,在FID(13.17)和CLIPSIM(0.3049)两项指标上,Make-A-Video都大幅刷新了SOTA。
此外,Meta AI的团队还使用了Imagen的DrawBench,进行人为主观评估。
他们邀请测试者亲身体验Make-A-Video,主观评估视频与文本之间的逻辑对应关系。
结果显示,Make-A-Video在质量和忠实度上都优于其他两种方法。
One More Thing
有意思的是,Meta发布新AI的同时,似乎也拉开了T2V模型竞速的序幕。
Stable Diffusion的母公司StabilityAI就坐不住了,创始人兼CEO Emad放话道:
我们将发布一个比Make-A-Video更好的模型,大家都能用的那种!
而就在前几天,ICLR网站上也出现了一篇相关论文Phenaki。
生成效果是这样的:
对了,虽然Make-A-Video尚未公开,但Meta AI官方也表示,准备推出一个Demo让大家可以实际上手体验,感兴趣的小伙伴可以蹲一波了~
相关文章
人还在,号没了?江苏省消保委:游戏运营商要把消费者利益放首位
转自:扬子晚报网扬子晚报网11月22日讯通讯员 徐悦 记者 马燕)暴雪与网易终止合作的风波殃及到你了吗?有网友戏称:“以前知道有账号继承制,我还挺高兴这东西还能传,好了,我人还在呢,号先走了。”对此,2025-07-09- 两天前,伦敦时间上星期五10月14日)刚过晌午,唐宁街10号火速举办了一场仅有8分钟的新闻发布会,英国财政政策就此发生了180度大转向。会上,刚上任五周的英国首相特拉斯,征召前外交大臣亨特Jeremy2025-07-09
- 来源:华尔街见闻市场猜测,在美国通胀数据引发日元剧烈波动之际,日本财务省上周已悄然入场稳定市场。交易员猜测,日本财务省上周可能已入场干预外汇。在美国公布9月通胀数据后,日元汇率周四一度跌至1990年以2025-07-09
- 北京青年报记者10月15日了解到,海南离岛旅客免税购物政策实施情况新闻发布会上透露,9月29日,海南两家离岛免税店按程序获得批准,其中海口市一家,为海口国际免税城;万宁市一家,为国际免税港。随着两家离2025-07-09
商务部:7月我国服务进出口总额4999亿元 同比增长15.7%
新浪财经公众号 24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注sinafinance)2025-07-09- 10月30日起,民航将正式开启冬春航季。随着换季临近,近日多家航空公司发布新航季航班计划,宣布恢复并加密多条国际航线。界面新闻从东航、南航、海航等航司获悉,为尽快贯彻落实国务院关于逐步、稳妥增加定期国2025-07-09
最新评论