AI创作更进一步 图片之后视频也被“拿捏” 汇集多项热门技术
《科创板日报》9月30日讯 Meta近期抛出了一个文字转视频(T2V)的拿捏AI模型——Make-A-Video(做个视频),输入几句话就能生成一段原创视频,创作该模型还可以把图片变成视频、更进从原视频得到多个衍生视频。步图被汇
文字描述为:一艘登陆火星的片之频也宇宙飞船文字描述为:机器人在时代广场跳舞把图片变成视频根据原视频生成新视频该模型建立在文字转图像(T2I)模型的基础上,即Meta的后视Make-A-Scene。研究人员通过对Make-A-Scene进行调整和训练,集多然后把它应用于视频生成模型,项热省去了文本-视频对训练这一环节,门技节省了大量的拿捏成本。
其实,创作在Make-A-Video之前,更进已经出现了多个T2V模型,步图被汇其中就包括清华大学和智源研究院研发的片之频也CogVideo,它也是后视目前唯一一个开源的T2V模型。更早之前,GODIVA和的“女娲”也都实现过根据文字描述生成视频。
Meta的研究人员采取了数据测试和人类打分两种方法对模型进行评估,与“前辈们”相比,Make-A-Video生成的视频质量更高,与文本更贴切。
值得注意的是,CogVideo与Make-A-Video的发布时间仅相差三个月。与此同时,一度爆红的T2I模型“Stable Diffusion”的母公司Stability AI已经跃跃欲试,其创始人Emad表示将很快发布一个比Make-A-Video更好的模型。
T2V 模型,为什么让大家趋之若鹜?
由文本生成影像,展示了自然语言处理技术与计算机视觉技术结合的潜力,可以理解为多项热门AI技术的交汇点。
其最直接的应用场景在于艺术、影视行业,如电影剧本编写、创意营销、教学视频,以及公共安全等众多领域。
对于曾“改名明志”的Meta来说,与文字转图像/视频有关的AI技术还连接着元宇宙,Meta已将AI团队并入AR/VR部门。
正如Meta所说,“我们在这个领域取得了进展,但这仅仅是开始。我们将继续使用这类新的生成创意工具来突破可能的界限,以构建在2D/3D中更丰富、更具表现力的消息传递以及混合现实和虚拟世界中人们之间的通信方式。”
值得注意的是,在T2V模型方面,尽管已有多家科技公司展现雄心,但它们依然面临不小的技术、伦理问题。
从Meta公布的作品来看,Make-A-Video生成的视频多少存在失真、掉帧的问题;因AI技术引发的争论性话题可谓层出不穷,前有Deepfake换脸术制造假新闻,后有AI绘画工具Midjourney生成画作获奖遭传统艺术家批评。
Meta甚至提前打起了预防针,在Make-A-Video的发布页面,这家公司声明:由于该模型可以创建看起来逼真的内容,因此我们为所有视频添加了水印,这将有助于确保观众认识到视频是假的。
相关文章:
- 热门中概股周一多数下跌 哔哩哔哩跌超8% 京东跌超6%
- 快讯:肝炎概念股震荡走强 海普瑞涨停
- 韩国电商巨头Coupang第一季度亏损收窄 盘后股价大涨约20%
- 你的LV、爱马仕包装千万别扔!它能卖上千块,有人靠这个产业每月躺赚2万4
- 20分钟上演“地天板”,这只次新股火了!上海透露氢能产业目标,规模剑指1000亿元,上市公司布局浮出水面
- 今夏柴油危机恐将进一步恶化 美国东海岸或实行定量配给
- 防人员聚集,5月凭证式储蓄国债暂停发行,银行建议错峰或延后兑付
- 新增本土“222+1630”,在这些地方
- 中国信通院发布报告:企业信用大数据行业市场规模已达千亿
- 小说无授权情况下被收录,北京一作家将起诉知网
- 土耳其称“爪剑”行动已消灭184名“恐怖分子”
- 英国监管机构:微软收购动视暴雪有碍市场竞争 不妥协将深入调查
- 生态环境部党组书记孙金龙、部长黄润秋在《光明日报》发表署名文章《以生态环境科技创新助力美丽中国建设》
- 突发!昊志机电董事长被立案,涉嫌内幕交易
- 液晶电视卖出“白菜价” 面板大厂减产自救很无奈
- “保交楼”再迎新政,2000亿元免息贷款支持计划将在6家商业银行展开
- 哪吒汽车副总裁兼商贸公司总裁周江:智能化技术成汽车产业新竞争点
- 央行拟规范金融控股公司关联交易行为 设置一年过渡期安排
- 农行副行长张毅:用更加多元、智能、便捷的金融服务助力新市民实现未来愿景
- 北京连续四年位居全球金融科技中心城市榜首