slug
type
status
date
tags
summary
category
icon
password
🔹 1. LANGUAGE MODELS (语言模型)
- 就是我们常说的 大语言模型 (LLM)。
- 主要任务:对话、问答、写作、代码生成、逻辑推理。
- 示例:Qwen、DeepSeek、LLaMA、GPT-OSS、Gemma 等。
- 应用场景:Chatbot、智能问答、代码助手。
🔹 2. EMBEDDING MODELS (嵌入模型)
- 输入文本,输出向量表示(embedding)。
- 向量化后可以用于 语义检索、相似度计算、知识库问答。
- 示例:OpenAI text-embedding-3、BGE(BAAI Embedding)、E5 系列。
- 应用场景:RAG(检索增强生成)、相似问题匹配、语义搜索。
🔹 3. RERANK MODELS (重排序模型)
- 给定一个查询 + 一组候选结果,模型负责 判断哪些更相关、重新排序。
- 作用:提升检索结果的质量,避免 embedding 检索误判。
- 示例:Cohere Rerank、BAAI bge-reranker。
- 应用场景:搜索引擎、问答系统、推荐系统。
🔹 4. IMAGE MODELS (图像模型)
- 用于 图像生成、编辑、识别。
- 分两类:
- 生成类:Stable Diffusion、SDXL、Flux → 根据文本生成图像。
- 理解类:CLIP、BLIP → 图文匹配、描述生成。
- 应用场景:AI 绘画、图文检索、文生图。
🔹 5. AUDIO MODELS (音频模型)
- 音频处理相关,包括 语音识别 (ASR)、语音合成 (TTS)。
- 示例:Whisper (OpenAI)、VALL-E、CosyVoice。
- 应用场景:语音助手、会议转写、语音客服。
🔹 6. VIDEO MODELS (视频模型)
- 用于 视频生成或理解。
- 示例:Sora(OpenAI)、Pika Labs、Runway Gen-2。
- 应用场景:文本生成视频、视频摘要、视频理解问答。
🔹 7. CUSTOM MODELS (自定义模型)
- 你可以加载自己下载或训练的模型。
- 格式一般是 HuggingFace 模型(transformers 格式 / GGUF / safetensors)。
- 应用场景:
- 把你本地 fine-tune 的模型放进来跑
- 加载特定领域模型(医学、金融、法律)。
✅ 总结一句话:
- Language Models = 聊天 / 生成
- Embedding Models = 向量化表示
- Rerank Models = 结果排序优化
- Image Models = 图像生成/识别
- Audio Models = 语音转文字 / 合成
- Video Models = 视频生成/理解
- Custom Models = 自己的模型
- Author:盛溪
- URL:https://tangly1024.com/article/%E5%90%84%E7%B1%BB%E6%A8%A1%E5%9E%8Bintro
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts

.jpg?table=block&id=26f7c1d5-a1e9-80d7-a52b-e71bb7079501&t=26f7c1d5-a1e9-80d7-a52b-e71bb7079501)
