63 分钟阅读230LLMOps
深入浅出:从「向量召回+BM25兜底」看现代搜索引擎的核心设计
构建搜索引擎或 RAG 系统时,向量召回 + BM25 兜底 是绕不开的经典组合。本文从策略动机出发,逐层拆解文档切分、Embedding、召回、重排四大环节,深挖倒排索引的底层原理,带你从零建立对现代搜索技术的完整认知。
Search EngineRAGBM25Vector SearchEmbeddingInverted IndexRerank
检索文章
构建搜索引擎或 RAG 系统时,向量召回 + BM25 兜底 是绕不开的经典组合。本文从策略动机出发,逐层拆解文档切分、Embedding、召回、重排四大环节,深挖倒排索引的底层原理,带你从零建立对现代搜索技术的完整认知。
大模型最让人头疼的问题,不是不会说,而是会一本正经地说错。本文系统拆解事实性幻觉与忠实性幻觉的区别,分析数据、模型与架构层面的根因,并从知识编辑、检索增强、RAG、向量数据库、Embedding、LangChain Document 到 LangGraph,讲清楚一套可落地的缓解思路。
LLMOps 是 AI 工程化领域最火的话题之一。但这玩意到底在解决什么?本文用一个真实的上线翻车故事开头,逐层拆开 Token、Embedding、Agent、Prompt Engineering、RAG、Fine-tuning 的真实含义,帮你建立自己的判断框架——什么时候该用、什么时候别碰、用错了会怎么死。