LLM 介绍
约 1100 字大约 4 分钟
2025-02-10
LLM
即大语言模型(Large Language Model
)是指使用大量文本数据训练的深度学习模型,使得该模型可以生成自然语言文本或理解语言文本的含义。这些模型可以通过在庞大的数据集上进行训练来提供有关各种主题的深入知识和语言生产。其核心思想是通过大规模的无监督训练学习自然语言的模式和结构,在一定程度上模拟人类的语言认知和生成过程。
Chat
OpenAI Chat
Gemini
DeepSeek Chat
通义千问
文心一言
智谱青言
豆包
Kimi
纳米AI搜索
绘图
Midjourney
Dall.E
音乐
Suno
Udio
视频
Luma
Runway
Pika
LLM 开放平台
OpenAI
现在大模型的标杆,模型能力很强,功能也比较稳定。
- 服务器在国外,需要代理才行
- API收费比较贵,阶梯收费
提示 目前我们公司是通过专线转到国外的服务器使用的。国内直接使用账号可能会被封掉
Gemini
Claude
Azure OpenAI
这是国内访问OpenAI的一个解决方案,需要公司开通Azure服务,且模型的更新稍慢
DeepSeek
开源兼容 OpenAI API
国内模型,无需代理即可使用,能力也强,各种量化版本都有,一些版本本地部署都可以。
- 一些功能还需要完善,比如:当前版本 deepseek-chat 模型 Function Calling 功能效果不稳定,会出现循环调用、空回复的情况。我们正在积极修复中,预计将在下一个版本中得到修复
- 当前服务器资源紧张(也可能是受攻击比较严重),已暂停 API 服务充值。
通义千问
开源兼容 OpenAI API
能力是国产模型中比较强的。我们需要用到Function Calling
经过测试,通义千问的这方面能力还是可以的。
提示 我们公司的AI产品,如果需要国产的话,基本是通义千问和智谱二选一。
智谱AI
开源兼容 OpenAI API
也是比较强的国产模型。Function Calling
能力比通义千问差一点儿,特别是填参格式需要简单处理一下,也存在填参截断的情况,之前提过工单,知道现在解决没有。
提示 我们公司的AI产品,如果需要国产的话,基本是通义千问和智谱二选一。
月之暗面
兼容 OpenAI API
能力还是可以,目前国内最大的上下文支持。之前用来做文本上传及内容检索,随着各家模型的上下文支持的不断提升,优势在减少。且RAG的发展对其也有一定的影响。
豆包
兼容 OpenAI API
之前测试,Function Calling
能力一般,存在循环调用的情况。
百度千帆
模型还可以,但是Function Calling
能力一般,API
自成一派,上下文长度支持也不高。
LLM 服务提供商
NIM
NVIDIA 的 NIM(NVIDIA Inference Microservices) 平台提供了 DeepSeek 模型的 API 支持。NVIDIA NIM 是一个高性能的推理服务平台,专为优化大模型的部署和推理而设计。通过 NVIDIA NIM,用户可以更高效地部署和管理 DeepSeek 模型。
硅基流动
派欧算力
比硅基流动速度略快
无问芯穹
APIShop
小网站
LLM 社区
魔搭社区
中国版的Hugging Face,模型丰富,国内访问特别快
提示 建议优先在这上面下载模型
Hugging Face
丰富的模型库,但国内访问较慢
提示 建议使用代理下载模型