文章详情

上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的S
2025-04-26 02:12:07
文章详情介绍
上海阶跃星辰智能科技有限公司宣布开源其最新的图生视频模型——Step-Video-TI2V。这一模型是基于30B参数的Step-Video-T2V训练而成,能够生成102帧、5秒、540P分辨率的视频,具有运动幅度可控和镜头运动可控两大核心特点,尤其在动漫效果方面表现出色。与现有的开源图生视频模型相比,Step-Video-TI2V不仅在参数规模上提供了更高的上限,其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性,为创作者提供了更灵活的选择。
Step-Video-TI2V的开发过程中,团队进行了两大关键优化。首先,引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同,该模型采用了更直接的方式,将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接,从而确保生成的视频与输入图片高度一致。其次,通过AdaLN模块引入视频动态性打分信息,使用户在生成视频时可以指定不同的运动级别,精准控制视频的动态幅度,从而平衡动态性、稳定性和一致性。此外,团队还对主体动作和镜头运动进行了专项精准标注,进一步提升了模型在主体动态性和运镜效果上的表现。
Step-Video-TI2V的核心特点包括运动幅度可控、多种运镜控制、动漫效果优异以及支持多尺寸生成。用户可以根据创作需求自由切换动态与稳定画面,生成从基本的推拉摇移、升降到复杂电影级运镜效果的视频。该模型在动漫类任务上的表现尤为突出,非常适合动画创作和短视频制作等应用场景。同时,它支持多种尺寸的图生视频,无论是横屏、竖屏还是方屏,都能满足不同平台的需求。
体验地址:
https://yuewen.cn/videos
GitHub:
https://github.com/stepfun-ai/Step-Video-TI2V
Github-ComfyUI:
https://github.com/stepfun-ai/ComfyUI-StepVideo
最新星火攻略
更多- Meta AI时隔将近一年再次回归欧洲市场,首度推出文本对话功能以满足用户需求
- 谷歌Chrome浏览器将整合Gemini AI助手,让用户操作变得更加便利!
- LG宣布开源EXAONE Deep推理AI模型,称其为韩国首个自主研发的人工智能推理解决方案
- 猫王音响拥抱AI科技:传统音响的智能化转型与未来发展
- 深圳推出人工智能先锋城市建设项目支持方案实施细则全面解读
- 东莞建立中国首个专注于制造业的城市级人工智能大模型中心,推动产业智能化转型
- 高阶用户的理想选择?OpenAI推出O1-Pro推理模型,百万Token售价高达600美元令人瞩目
- 腾讯混元再度发力,全新推理模型T1将于3月21日晚正式发布,敬请期待新科技盛宴!
- Google Chrome将整合Gemini AI技术,为用户带来更加智能化的浏览体验升级
- 大话西游3自由人序列号获取解析 与大话西游3自由人序列号使用技巧详解
- Adobe推出“Project Slide Wow”项目,让数据瞬间变换为引人注目的精彩PPT演示文稿
- Orpheus TTS:新一代人类情感表达贴近的语音合成模型
- 仙剑五前传详细攻略及玩法解析 全面解读仙剑五前传各大任务与角色攻略
- 微软与贝莱德伙伴关系携手马斯克xAI,共同推动300亿美元人工智能基础设施合作联盟
- 波士顿动力的Atlas机器人展示非凡运动才能:快速奔跑、华丽翻滚、灵活侧翻及动感霹雳舞
最新星火智能
更多- 英伟达大举收购合成数据初创企业Gretel,助力推动生成式AI技术的快速发展
- 波士顿动力Atlas机器人最新进展:展现出接近人类的灵活动作能力引发广泛关注
- DNF黑暗武士PK技巧全面解析与实战经验分享
- OpenAI 研究负责人表示某些类型的“推理”人工智能模型实际上可以在20年前就已问世
- 微软携手瑞士Inait,共同研发受哺乳动物大脑启发的创新AI模型,以推动智能技术的进步
- 广州潮流文化盛会,吸引年轻潮人,网友小李:沉醉于这一场时尚盛筵
- Adobe全新“Project Slide Wow”发布,助你轻松一键制作专业PowerPoint,完全无需编程技能!
- 燕云十六声天上来支线任务快速通关技巧与详细攻略分享
- 马斯克的Grok在X平台上被用作“事实核查”,引发人工核查员对于潜在误导信息的严重担忧
- 星之彼端试炼血御褐关卡攻略指南与实用通关技巧分享
- OpenAI 向美国当局提出关于人工智能发展与监管的综合行动计划建议
- 不知火御魂搭配分析与最佳选择详解,帮助你提升角色实力
- OpenAI推出全新升级版AI模型o1-pro,生成成本是o1的十倍,打造最昂贵的人工智能体验
- 深入解析不断上升的黑暗商业现象:其实际目的及对社会的潜在影响研究
- 魔兽世界90到100级快速升级技巧与全面攻略分享,助你轻松畅游艾泽拉斯