近日,以色列科技公司Lightricks发布了其开源AI视频生成模型的最新版本——LTX-Video-13B精炼模型(LTXV-13B v0.9.7-distilled)。这款模型以130亿参数为基础,通过多尺度渲染技术和高效量化优化,将视频生成速度提升至惊人的10秒以内,标志着AI视频生成技术的新里程碑。AIbase深入解析这一突破性进展,带您了解其技术亮点与行业影响。
项目地址:https://github.com/Lightricks/LTX-Video
模型地址:https://huggingface.co/spaces/Lightricks/ltx-video-distilled
技术突破:10秒生成高清视频
LTX-Video-13B精炼模型采用先进的多尺度渲染技术,通过从低分辨率草图逐步精炼至高清画质,显著缩短了视频生成时间。据AIbase了解,该模型能够在NVIDIA RTX4090等消费级GPU上实现10秒内生成1216×704分辨率视频,相较上一代模型提速近5倍,低分辨率预览甚至仅需3秒。这种速度突破使得实时视频生成成为可能,为创作者提供了前所未有的效率体验。
此外,该模型支持关键帧编辑、相机运动控制和多镜头序列,赋予用户更高的创作自由度。无论是生成动态场景还是复杂的人物动作,LTXV-13B都能呈现更流畅的运动轨迹和更清晰的细节,视频质量媲美专业影视作品。
开源赋能:低显存设备也能玩转AI视频
作为一款完全开源的模型,LTX-Video-13B精炼模型延续了Lightricks对技术普惠的承诺。AIbase注意到,该模型特别推出了量化版本(fp8)和LoRA适配版本,大幅降低了硬件门槛。即使在低显存设备上,用户也能运行该模型,生成高质量视频。这一特性尤其适合独立创作者和中小企业,极大地降低了AI视频制作的成本。
模型已在Hugging Face和GitHub上开放下载,并通过ComfyUI提供兼容支持,开发者可以轻松集成到现有工作流中。Lightricks还为年收入低于1000万美元的企业提供免费许可,进一步推动了AI视频技术的普及。
效率与质量兼得:30倍速度提升的秘密
LTX-Video-13B精炼模型不仅速度惊人,还在视频质量上实现了显著提升。得益于与Shutterstock和Getty Images的合作,该模型在高质量视频数据集上进行了训练,生成的视频画面更具电影感,场景连贯性更强。AIbase获悉,其核心技术UEfficient Q8内核优化了模型在消费级硬件上的性能,确保即便在普通笔记本电脑上也能实现高效运行。
相比同类模型,LTXV-13B的生成速度提高了30倍,生成一个视频的平均时间仅为37.59秒,而竞争对手在同等硬件上可能需要近25分钟。这种效率的飞跃,使其在实时生成、虚拟主播(VTubing)等场景中展现出巨大潜力。
行业影响:挑战OpenAI与Google的国产力量
Lightricks此次发布被业内视为对OpenAI Sora、Google Veo等巨头模型的强有力挑战。AIbase分析认为,LTX-Video-13B精炼模型以更低的训练成本(仅数千万美元)实现了媲美顶级模型的性能,展现了开源社区和中小型科技公司在AI领域的创新能力。其多尺度渲染和VACE模型推理等开源贡献,也为全球AI视频生成技术的发展注入了新活力。
对于创作者而言,LTXV-13B的出现意味着无需昂贵的专业设备,就能制作出高质量的动画、短片或营销视频。AIbase预测,该模型将加速AI视频工具在影视、广告和社交媒体领域的普及,重塑内容创作生态。
AI视频生成的“Deepseek时刻”
作为AI领域的专业媒体,AIbase认为,LTX-Video-13B精炼模型的发布不仅是Lightricks的技术巅峰之作,更是开源AI社区的一次集体胜利。其超高速生成能力和低硬件门槛,打破了AI视频生成的技术壁垒,让更多人能够参与到智能化创作中。
评论 (0)