第2024章 18：英伟达市值第一，超越微软！马斯克力挺人形机器人_灵魂交响曲：人工智能日记

DeepSeek-Coder V2拥有236B参数，代码和数学能力介于GPT-4o和GPT-4-Turbo之间。

模型具备高通用性能，是国内中英通用能力的领先者；全面开源，提供236B和16B两种参数规模的模型，支持商业使用无需申请。

Runway深夜发布Gen-3，暴打Sora

AI视频老牌选手Runway深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级，画面细节直接到达了电影级画质，再次震惊全体网友。

Runway认为，Gen-3 Alpha的诞生，意味着我们离通用世界模型和新一代AI视频又近了一步。

国产Sora单镜头16秒720p一键生成

潞晨Open-Sora团队通过其开源项目实现了16秒720p视频的一键生成，提升了视频质量和生成速度；

模型权重和训练代码完全开源，使用户可以直接参与并创造自己的视频内容。

Google发布根据视频生成音频技术V2A

Google DeepMind发展了V2A技术，能将视频像素和文本提示结合生成逼真音效，提高音视频同步生成的真实感。

V2A能为各类视频，包括无声电影和档案资料，添加配音和音效，提供广泛的创作可能性。V2A使用扩散模型从视频输入和语言提示生成同步音频，系统能自动对齐声音和视频，无需人工调整。

麦当劳：准备和谷歌AI合作？

麦当劳似乎正在改变其人工智能（AI）计划的方向。据报道，麦当劳即将终止与IBM的“AI订餐”合作，但坚称人工智能将在未来的免下车服务（drive-thru，俗称“得来速”）中占有一席之地。