第2024章 AI大模型:Kimi支持200万字无损上下文;马斯克Grok开源

“紫东太初”大模型在研发之初即以多模态技术为核心,利用图-音-文等更多类型数据进行跨模态的统一表征和学习, 实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”。针对智能驾驶,“紫东太初”将大幅缩短、优化其训练过程。通过大语言模型和多模态能力,大模型可以替代海量的人工,完成汽车、信号灯、路标等数据的自动标注,大幅提升智能汽车感知世界的效率。

6.腾讯联合推出图生视频大模型“Follow Your Click”

腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。

7.零一万物:宣布开源Yi-9B模型

李开复旗下的AI公司零一万物宣布开源了 Yi-9B 模型,该模型是 Yi 系列中最强的模型,实际参数为 8.8B,默认上下文长度为 4K tokens。Yi-9B 在多个方面的性能都超过了其他开源模型,如 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。此外,Yi-9B(BF 16)和其量化版 Yi-9B(Int8)可以在消费级显卡上轻松部署,使用成本较低,对开发者友好。该公司此前已推出 Yi-34B 和 Yi-6B 两个开源大模型,对学术研究完全开放,并同步开放免费商用申请。

本小章还未完,请点击下一页继续阅读后面精彩内容!

8.阿里通义千问重:免费开放1000万字长文档处理

3月22日,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。

即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和 APP 快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

9.阶跃星辰发布 Step-2万亿参数MoE语言大模型预览版

在2024全球开发者先锋大会上,通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰研发的Step-1V千亿参数多模态大模型,在中国权威的大型模型评估平台「司南」(OpenCompass)多模态模型评测榜单中位列第一,性能比肩 GPT-4V。

阶跃星辰创始人、CEO姜大昕博士在大会上正式对外发布了Step-2万亿参数 MoE 语言大模型预览版。模型采用 MoE 架构,聚焦深度智能的探索,并提供API接口给部分合作伙伴试用。据了解,参数量从千亿到万亿,对算力、系统、数据、算法四个方面都提出了极高的要求,业内只有极少数公司能做到。

10.紫光云发布紫鸾 5.0 云平台