【RAG】语义搜索的实现
语义搜索和检索增强生成(RAG)的概念及实现步骤,诸如数据准备、文本预处理、嵌入、构建索引、查询理解和结果呈现等。文章还探讨了如何处理RAG中的挑战,包括重复信息、冲突信息、时效性问题、元数据查询与关键词查询的结合,以及处理多Query的多跳问题。文中还提出了使用开源系统Langchain-Chatchat作为实现工具的建议,以提高语言模型的性能,并通过添加提供数据的信息检索来增强其功能。
语义搜索和检索增强生成(RAG)的概念及实现步骤,诸如数据准备、文本预处理、嵌入、构建索引、查询理解和结果呈现等。文章还探讨了如何处理RAG中的挑战,包括重复信息、冲突信息、时效性问题、元数据查询与关键词查询的结合,以及处理多Query的多跳问题。文中还提出了使用开源系统Langchain-Chatchat作为实现工具的建议,以提高语言模型的性能,并通过添加提供数据的信息检索来增强其功能。
最近对学习阳明心学,对心外无物有两层的认知:
第一层 物物而不物于物
某个物体,过度在意就会受制于该物体;不在意不刻意,反而不被受其累。
比如孤独,你在意它,它就是孤独,你享受他,它就是自由。
第二层 翻身做主人
上帝视角审视自己与某物体的关系,合着用、废则弃。
最近在研究操作日志,将需求中部分共享部分内容单独抽离出来,将整个需求的调研、实现细节进行描述,供各位小伙伴了解和共同成长。
操作日志基本成为了B端产品的标配,其背后是企业管理层面的诉求,希望借助于操作日志更好的进行监管和促成协作,确保团队行动的一致性。C端产品较少出现操作日志,主要是因为其个人的操作并不会影响他人。虽然操作日志成为标配,但在一定程度上查看团队其他人的行为动作信息依然可能存在一定的法律风险,目前国内基本上没有明确的引导或告知。
问题的动机 Problem Motivation 异常检测(Anomaly detection)问题是机器学习 …
降维(Dimensionality Reduction)是指将高维数据集中的特征维度减少到较低维度的过程。高维 …
无监督学习:简介 Unsupervised Learning_ Introduction 有一系列点,却没有标 …
支持向量机(Support Vector Machine,SVM)是一种机器学习算法,用于分类和回归分析。它是 …
决定下一步做什么 Deciding What to Try Next 当训练好了的模型来预测未知数据的时候发现 …
吴恩达机器学习一站式学习系列(10)—应用机器学习的建议 Advice for Applying Machine Learning 查看全文 »
首先要做什么 Prioritizing What to Work On 以一个垃圾邮件分类器算法为例进行讨论。 …
吴恩达机器学习一站式学习系列(9)——系统的设计 Machine Learning System Design 查看全文 »