第2024章 6丨OpenAI公开前沿大模型安全策略;Pika获8000万美元融资

5.音频模型Stable Audio Open开源

6月6日,着名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型Stable Audio Open。

用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。

6.Meta 翻译大杀器NLLB200登上Nature

6月5日,Meta在《自然》杂志发表了一篇文章推出一种AI模型:No Language Left Behind (NLLB) ,能够在 200 种语言之间直接提供高质量的翻译,质量提升44%,尤其在低资源语言上表现显着;

NLLB-200采用稀疏门控专家混合(MoE)架构,通过动态激活专家网络优化多语言任务的处理性能。

7.上交大通过AI重建「窒息的海洋」

上海交大团队开发OxyGenerator模型,利用AI重建1920至2023年全球海洋溶解氧数据,重建性能超越传统数值模式;

模型显示过去百年溶解氧最小值区域面积扩大三倍,揭示海洋脱氧趋势对生态系统的影响;

OxyGenerator采用多层感知机、双向LSTM和自适应分区图消息传递机制,结合海洋学知识,显着提升重建精度。

8.北航推出全球遥感图像生成模型MetaEarth

北航团队开发MetaEarth模型,可在全球任意位置生成多种分辨率的遥感图像,考虑地形、气候、植被等复杂特征;

MetaEarth基于6亿参数的扩散模型,采用分辨率引导的自级联生成框架,实现连续无界图像生成,具备高分辨率、多样化场景生成能力;