DeepSeek-Coder V2拥有236B参数,代码和数学能力介于GPT-4o和GPT-4-Turbo之间。
模型具备高通用性能,是国内中英通用能力的领先者;全面开源,提供236B和16B两种参数规模的模型,支持商业使用无需申请。
Runway深夜发布Gen-3,暴打Sora
AI视频老牌选手Runway深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直接到达了电影级画质,再次震惊全体网友。
Runway认为,Gen-3 Alpha的诞生,意味着我们离通用世界模型和新一代AI视频又近了一步。
国产Sora单镜头16秒720p一键生成
潞晨Open-Sora团队通过其开源项目实现了16秒720p视频的一键生成,提升了视频质量和生成速度;
模型权重和训练代码完全开源,使用户可以直接参与并创造自己的视频内容。
Google发布根据视频生成音频技术V2A
Google DeepMind发展了V2A技术,能将视频像素和文本提示结合生成逼真音效,提高音视频同步生成的真实感。
V2A能为各类视频,包括无声电影和档案资料,添加配音和音效,提供广泛的创作可能性。V2A使用扩散模型从视频输入和语言提示生成同步音频,系统能自动对齐声音和视频,无需人工调整。
麦当劳:准备和谷歌AI合作?
麦当劳似乎正在改变其人工智能(AI)计划的方向。据报道,麦当劳即将终止与IBM的“AI订餐”合作,但坚称人工智能将在未来的免下车服务(drive-thru,俗称“得来速”)中占有一席之地。