检索文章

检索文章

深入浅出：从「向量召回+BM25兜底」看现代搜索引擎的核心设计

构建搜索引擎或 RAG 系统时，向量召回 + BM25 兜底是绕不开的经典组合。本文从策略动机出发，逐层拆解文档切分、Embedding、召回、重排四大环节，深挖倒排索引的底层原理，带你从零建立对现代搜索技术的完整认知。

Search EngineRAGBM25Vector SearchEmbeddingInverted IndexRerank

2025-08-0386 分钟阅读61LLMOps

大模型为什么会幻觉：从事实性错误到 RAG 缓解方案全解

大模型最让人头疼的问题，不是不会说，而是会一本正经地说错。本文系统拆解事实性幻觉与忠实性幻觉的区别，分析数据、模型与架构层面的根因，并从知识编辑、检索增强、RAG、向量数据库、Embedding、LangChain Document 到 LangGraph，讲清楚一套可落地的缓解思路。

LLMRAGVector DatabaseLangChainLangGraph

2025-02-2092 分钟阅读384LLMOps

LLMOps 入门：把大模型变成生产力

LLMOps 是 AI 工程化领域最火的话题之一。但这玩意到底在解决什么？本文用一个真实的上线翻车故事开头，逐层拆开 Token、Embedding、Agent、Prompt Engineering、RAG、Fine-tuning 的真实含义，帮你建立自己的判断框架——什么时候该用、什么时候别碰、用错了会怎么死。

AI AgentDifyRAGPrompt Engineering

加载中...

分类

标签

深入浅出：从「向量召回+BM25兜底」看现代搜索引擎的核心设计

大模型为什么会幻觉：从事实性错误到 RAG 缓解方案全解

LLMOps 入门：把大模型变成生产力

分类

标签

深入浅出：从「向量召回+BM25兜底」看现代搜索引擎的核心设计

大模型为什么会幻觉：从事实性错误到 RAG 缓解方案全解

LLMOps 入门：把大模型变成生产力