slug
type
status
date
tags
summary
category
icon
password

🔹 1. LANGUAGE MODELS (语言模型)

  • 就是我们常说的 大语言模型 (LLM)
  • 主要任务:对话、问答、写作、代码生成、逻辑推理。
  • 示例:Qwen、DeepSeek、LLaMA、GPT-OSS、Gemma 等。
  • 应用场景:Chatbot、智能问答、代码助手。

🔹 2. EMBEDDING MODELS (嵌入模型)

  • 输入文本,输出向量表示(embedding)。
  • 向量化后可以用于 语义检索、相似度计算、知识库问答
  • 示例:OpenAI text-embedding-3、BGE(BAAI Embedding)、E5 系列。
  • 应用场景:RAG(检索增强生成)、相似问题匹配、语义搜索。

🔹 3. RERANK MODELS (重排序模型)

  • 给定一个查询 + 一组候选结果,模型负责 判断哪些更相关、重新排序
  • 作用:提升检索结果的质量,避免 embedding 检索误判。
  • 示例:Cohere Rerank、BAAI bge-reranker。
  • 应用场景:搜索引擎、问答系统、推荐系统。

🔹 4. IMAGE MODELS (图像模型)

  • 用于 图像生成、编辑、识别
  • 分两类:
    • 生成类:Stable Diffusion、SDXL、Flux → 根据文本生成图像。
    • 理解类:CLIP、BLIP → 图文匹配、描述生成。
  • 应用场景:AI 绘画、图文检索、文生图。

🔹 5. AUDIO MODELS (音频模型)

  • 音频处理相关,包括 语音识别 (ASR)语音合成 (TTS)
  • 示例:Whisper (OpenAI)、VALL-E、CosyVoice。
  • 应用场景:语音助手、会议转写、语音客服。

🔹 6. VIDEO MODELS (视频模型)

  • 用于 视频生成或理解
  • 示例:Sora(OpenAI)、Pika Labs、Runway Gen-2。
  • 应用场景:文本生成视频、视频摘要、视频理解问答。

🔹 7. CUSTOM MODELS (自定义模型)

  • 你可以加载自己下载或训练的模型。
  • 格式一般是 HuggingFace 模型(transformers 格式 / GGUF / safetensors)。
  • 应用场景
    • 把你本地 fine-tune 的模型放进来跑
    • 加载特定领域模型(医学、金融、法律)。

总结一句话
  • Language Models = 聊天 / 生成
  • Embedding Models = 向量化表示
  • Rerank Models = 结果排序优化
  • Image Models = 图像生成/识别
  • Audio Models = 语音转文字 / 合成
  • Video Models = 视频生成/理解
  • Custom Models = 自己的模型
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Cluade Code 使用哲学洞察从Pavel Durov汲取到的理念与力量
Loading...
盛溪
盛溪
盛溪的学习&生活博客
Announcement
🌟 欢迎来到盛溪的博客!🌟
大家好,我是盛溪。在这里,我将分享我的生活感悟、学习心得以及其他一些有趣的发现。希望我的文章能为你的生活带来一点启发和乐趣。
微信号: felix_windsor
📅 更新通知:
  • 我会定期更新博客,分享新的内容。
💬 互动环节:
  • 如果你有任何问题或想法,欢迎在评论区留言。我非常期待与你的互动!
📚 推荐阅读:
  • 不定期推荐一些我觉得有价值的书籍或资源,希望能对你有所帮助。
感谢你的访问和支持,希望你能常来逛逛!
盛溪敬上