【环球网科技综合报道】12月2日消息,爱诗科技正式发布了PixVerse V5.5,国内版为拍我AI V5.5。这一新版本标志着 AI 视频从“镜头生成”向自动“讲故事”的进化,进入具备“完整叙事能力”的实用阶段。与以往只能产出单镜头或零散画面的大模型不同,V5.5 可以生成具备叙事结构的短片,甚至接近“成片”质量的视频。
据了解,此次更新首次支持音频(Audio)与多镜头(Multi-shot)同步生成,并强化了多角色音画同步能力。AI 能够根据用户输入的提示词,自动理解并生成完整的故事段落,而非仅仅提供单一镜头的素材。用户只需要输入一个简短的提示,AI 就能完成镜头推进、景别切换、人物对白、环境声和背景音乐的生成,直接呈现一个可被使用的叙事片段。
在拍我AI(PixVerse)中,用户可以在V5.5大模型多镜头和音画同步打开状态下,生成5秒、8 秒、10秒的视频。用户现在可以在提示词(Prompt)里直接控制“音效、台词、音色、音乐、镜头”,AI 能自动理解提示词中的叙事意图,自动设计推拉、摇移、切换、景别变化等镜头语言。AI 的运镜节奏更自然,紧贴真实制作逻辑,带给用户“成为导演”般的创作体验。
音画同步的能力也得到了飞跃性提升。V5.5 成为国内首个可以在一次生成中实现“分镜 + 声音”的 AI 视频生成大模型。画面生成的同时,人物对白、口型、表情、动作、环境声和背景音乐被自动融合,呈现出自然协调的多角色互动。这一能力的实现,使得创作者无需再额外调参或上传音频,便能生成近乎“直出成片”的高质量视频。
目前,拍我AI(PixVerse)海内外创作者社区的测试反馈来看,V5.5 多镜头能力足以改变短视频的创作方式。过去,创作者需要依赖摄影师和剪辑师的配合,才能完成具有“黄金三秒开场节奏”的镜头。现在, AI 就能自动生成这一部分内容。(勃潺)