AI

【AIGC】文生文的普及性概述

AIGC / 2023年12月25日

LLM很厉害，可以用来进行概要提取、编写提示词、做情感分析、做数据清洗等等。
从内容创作的产业链进行分析，AIGC文生文可能存在的运用场景，以及可以解决的行业痛点。作为新一代的内容生产方式具有很重要的使用场景，其中营销文案是最为典型的场景。
针对营销场景需要有不同的prompt模板，但背后的Prompt框架经过抽象却可以是一致性的。
在文章最后也对writesonic进行了竞品分析和总结。

【RAG】语义搜索提升准确率的方法

AI, RAG / 2023年12月25日

这是一篇关于LlamaIndex框架的文章，主要描述了实施RAG（Retrieval-Augmented Generation）时需要考虑的一些关键技术因素，包括分块、查询增强、文档层次结构、多跳推理和知识图谱等。
在自然语言处理中，“分块”是一个重要概念，可以将大文本划分为小而有意义的“块”，从而提高RAG系统的检索效率和准确性。此外，文章还介绍了重叠分块的方法，这是一种在保证块大小和质量的同时，可提高数据检索效率的策略。
文章还讨论了文档层次结构的概念，这是一种将数据以有序、分级的方式进行组织的方法，可以帮助RAG系统更高效地检索和处理相关联的数据。
知识图谱作为一种表示实体及其关系的数据结构，也在RAG系统中发挥了重要作用。它可以为大量数据提供一致性，并且可以准确地检索相关规则和概念，从而减少错误。
查询增强是另一个需要注意的点。在处理模糊或复杂的问题时，查询增强可以通过预处理查询并添加领域特定的上下文来提高问题的清晰度和相关性。

【RAG】语义搜索的评测方法

AI, RAG / 2023年12月25日

文章主要描述了两种评估RAG（Retrieval-Augmented Generation）产品可用性的方法。
一种是RAGAs（检索增强生成评估）框架，通过对检索组件和生成组件的单独评估，以及对整体流程的评估，来衡量RAG系统的性能。其中包括上下文精确度、上下文召回率、真实性、答案相关度等多个指标。
另一种方法是结合传统指标如流畅性、实用性、引文召回率和引文精确度，采用人工打分和计算调和平均数的方式来评估RAG系统的性能。
这两种方法都可以帮助确定RAG产品的可用性，以便在实际业务中进行应用。

【RAG】语义搜索的实现

AIGC, RAG, 向量数据库 / 2023年11月17日

语义搜索和检索增强生成（RAG）的概念及实现步骤，诸如数据准备、文本预处理、嵌入、构建索引、查询理解和结果呈现等。文章还探讨了如何处理RAG中的挑战，包括重复信息、冲突信息、时效性问题、元数据查询与关键词查询的结合，以及处理多Query的多跳问题。文中还提出了使用开源系统Langchain-Chatchat作为实现工具的建议，以提高语言模型的性能，并通过添加提供数据的信息检索来增强其功能。

吴恩达机器学习一站式学习系列（14）— 异常检测 Anomaly Detection

AI, 机器学习 / 2023年9月16日

问题的动机 Problem Motivation 异常检测(Anomaly detection)问题是机器学习 …

吴恩达机器学习一站式学习系列（14）— 异常检测 Anomaly Detection 查看全文 »

吴恩达机器学习一站式学习系列（13）— 降维 Dimensionality Reduction

AI, 机器学习 / 2023年9月16日

降维（Dimensionality Reduction）是指将高维数据集中的特征维度减少到较低维度的过程。高维 …

吴恩达机器学习一站式学习系列（13）— 降维 Dimensionality Reduction 查看全文 »

吴恩达机器学习一站式学习系列（12）— 聚类 Clustering

AI, 机器学习 / 2023年9月16日

无监督学习：简介 Unsupervised Learning_ Introduction 有一系列点，却没有标 …

吴恩达机器学习一站式学习系列（12）— 聚类 Clustering 查看全文 »

吴恩达机器学习一站式学习系列（11）—支持向量机 Support Vector Machines

AI, 机器学习 / 2023年9月16日

支持向量机（Support Vector Machine，SVM）是一种机器学习算法，用于分类和回归分析。它是 …

吴恩达机器学习一站式学习系列（11）—支持向量机 Support Vector Machines 查看全文 »

吴恩达机器学习一站式学习系列（10）—应用机器学习的建议 Advice for Applying Machine Learning

AI, 机器学习 / 2023年9月16日

决定下一步做什么 Deciding What to Try Next 当训练好了的模型来预测未知数据的时候发现 …

吴恩达机器学习一站式学习系列（10）—应用机器学习的建议 Advice for Applying Machine Learning 查看全文 »

吴恩达机器学习一站式学习系列（9）——系统的设计 Machine Learning System Design

AI, 机器学习 / 2023年9月4日

首先要做什么 Prioritizing What to Work On 以一个垃圾邮件分类器算法为例进行讨论。 …

吴恩达机器学习一站式学习系列（9）——系统的设计 Machine Learning System Design 查看全文 »