截至2025年3月,中国大模型领域的主要参与者可分为以下几类,综合技术实力、市场布局及行业影响力:
一、互联网与科技巨头
1. 百度(文心一言)
- 文心一言是国内最早开放的生成式AI大模型之一,支持文学创作、数理逻辑、多模态生成等功能,日调用量超6亿次,搜索结果的18%由AI生成。2024年升级至4.0版本,在数学和编程领域表现突出。
2. 阿里巴巴(通义千问)
- 通义千问2.1版在代码生成、数学推理等能力上提升显著,2025年推出的旗舰版Qwen2.5-Max在全球评测中位列第七。阿里云通过“百炼”平台推动大模型商业化,AI相关收入实现三位数增长。
3. 腾讯(混元大模型)
- 混元大模型支持万亿参数规模,已落地近700个内部业务场景,并在2024年接入DeepSeek模型,结合微信生态探索搜索领域革新。
4. 华为
- 作为ICT领域巨头,华为在算力芯片(如昇腾)和大模型训练框架上提供底层支持,与科大讯飞等企业合作推动国产化算力生态。
二、垂直领域领军企业
1. 科大讯飞(星火大模型)
- 星火大模型以“全栈自主可控”为核心优势,基于国产算力平台开发,在医疗、法律、教育等垂直领域评测表现超越ChatGPT,部分能力接近GPT-4。
2. 商汤科技(商量大模型)
- 以计算机视觉技术为基础,拓展至多模态大模型,在情商评测中排名第一,入选“未来领袖象限”。
3. 百川智能(Baichuan系列)
- 专注医疗领域,Baichuan 3在中文任务评测中宣称超越GPT-4,技术迭代快,2024年获50亿元A轮融资。
三、新兴初创企业与开源先锋
1. 深度求索(DeepSeek)
- 推出开源模型DeepSeek R1,以高效部署和低成本著称,获中国移动算力支持,接入阿里、腾讯、字节等超级应用,用户覆盖数亿级。
2. 月之暗面(Kimi Chat)
- 支持20万汉字长文本处理,功能覆盖总结、搜索、代码生成等,技术轻量化适配多场景需求。
3. 智谱AI(ChatGLM)
- 源自清华团队,开源模型ChatGLM3在多任务评测中性能提升显著,日均调用量达400亿Tokens。
#大模型 #大模型公司