【ELO-297】手コキでベロちゅ~ 12 “神笔马良版Sora”,阿里团队推出视频AI生成框架Tora:画圈操控物体知道轨迹
发布日期:2024-08-08 05:56 点击次数:176
Tora由一个轨迹索要器(TE)、一个时空DiT和一个知道指导交融器(MGF)构成。
IT之家 8 月 6 日音问,阿里团队最新推出了 AI 视频生成框架 Tora【ELO-297】手コキでベロちゅ~ 12,同期集成了文本、视觉和轨迹条款用于生成视频,是基于轨迹导向的扩散变换器(DiT)本领。
Tora 由一个轨迹索要器(TE)、一个时空 DiT 和一个知道指导交融器(MGF)构成:
TE 使用 3D 视频压缩收罗将苟且轨迹编码为分层时空知道补丁。
MGF 将知道贴片集成到 DiT 模块中,以生成罢黜轨迹的连贯视频。
【ELO-297】手コキでベロちゅ~ 12
Tora 无缝契合 DiT 打算,复古制作最长 204 帧、720P 辞别率的视频,不错精确遗弃不同抓续时辰、宽高比和辞别率的视频试验。大批实考解说,Tora 在已毕高知道保真度方面施展出色,同期还能细巧模拟物理宇宙的知道。
很很鲁其特有打算理念交融文本、视觉和轨迹条款,精确遗弃视频试验,模拟物理宇宙知道规矩,为电影殊效制作、凭空现实限度带来无穷可能。
IT之家附上参考地址
Tora:Trajectory-oriented Diffusion Transformer for Video Generation
GitHub 仓库
本领论文【ELO-297】手コキでベロちゅ~ 12