Midjourney公司计划在未来几个月推出“文本转视频”模型,通过在1月开始培训视频模型,强调其自然发展和在生成视频领域引入竞争动态,同时V6更新提升画质和用户体验。
【AiBase提要】论文网址:https://arxiv.org/abs/2312.17234
Midjourney官方介绍称,V6版本使用户能够生成更真实、更详细的图像。同时,“快刀青衣”表示,Midjourney保留了对景点最美好的想象,不再有明显的AI痕迹。他的推文获得了超过62万的浏览量,近3千次点赞和标记。
另外,DreamTalk还具有说话风格预测的功能,能够根据语音预测说话者的风格,并同步表情,使得动画更加贴近原始音频。此外,该框架适用于多种场景,可以用于歌曲、不同类型的肖像,甚至在嘈杂环境中也能表现良好。