第2024章 6丨OpenAI公开前沿大模型安全策略；Pika获8000万美元融资_灵魂交响曲：人工智能日记

5．音频模型Stable Audio Open开源

6月6日，着名开源大模型平台Stability.ai在官网宣布，开源最新文生音频模型Stable Audio Open。

用户通过文本就能生成最多47秒，钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。

6．Meta 翻译大杀器NLLB200登上Nature

6月5日，Meta在《自然》杂志发表了一篇文章推出一种AI模型：No Language Left Behind (NLLB) ，能够在 200 种语言之间直接提供高质量的翻译，质量提升44%，尤其在低资源语言上表现显着；

NLLB-200采用稀疏门控专家混合（MoE）架构，通过动态激活专家网络优化多语言任务的处理性能。

7．上交大通过AI重建「窒息的海洋」

上海交大团队开发OxyGenerator模型，利用AI重建1920至2023年全球海洋溶解氧数据，重建性能超越传统数值模式；

模型显示过去百年溶解氧最小值区域面积扩大三倍，揭示海洋脱氧趋势对生态系统的影响；

OxyGenerator采用多层感知机、双向LSTM和自适应分区图消息传递机制，结合海洋学知识，显着提升重建精度。

8．北航推出全球遥感图像生成模型MetaEarth

北航团队开发MetaEarth模型，可在全球任意位置生成多种分辨率的遥感图像，考虑地形、气候、植被等复杂特征；

MetaEarth基于6亿参数的扩散模型，采用分辨率引导的自级联生成框架，实现连续无界图像生成，具备高分辨率、多样化场景生成能力；