ai
  • index
  • 1.欢迎来到LlamaIndex
  • 2.高级概念
  • 3.安装与设置
  • 4.入门教程(使用OpenAI)
  • 5.入门教程(使用本地LLMs)
  • 6.构建一个LLM应用
  • 7.使用LLMs
  • pydantic
  • asyncio
  • apikey
  • 8.RAG简介
  • 9.加载数据
  • 10.索引
  • 11.存储
  • 12.查询
  • weaviate
  • Cohere
  • warnings
  • WeaviateStart
  • spacy
  • 使用LlamaIndex构建全栈Web应用指南
  • back2
  • back4
  • front2
  • front4
  • front6
  • front8
  • llamaindex_backend
  • llamaindex_frontend
  • 1. 高级概念
  • 2. 大型语言模型(LLMs)
  • 3. 代理式应用
  • 4. 代理
  • 5. 检索增强生成(RAG)
  • 6. 用例
    • 6.1 代理
    • 6.2 工作流程
    • 6.3 结构化数据提取
    • 6.4 查询引擎
    • 6.5 聊天引擎

1. 高级概念 #

这是一份快速指南,介绍构建LLM应用时频繁遇到的高级概念。

2. 大型语言模型(LLMs) #

LLMs是推动LlamaIndex诞生的基础性创新技术。这是一种人工智能(AI)计算机系统,能够理解、生成和操控自然语言,包括根据其训练数据或查询时提供的数据来回答问题。您可以通过了解更多关于使用LLMs的信息。

3. 代理式应用 #

当LLM被应用于某个程序时,它通常用于做出决策、采取行动和/或与外界交互。这正是代理式应用。

虽然代理应用程序的定义宽泛,但有几个关键特征定义了这类应用:

  • LLM增强 - LLM通过工具(即代码中任意可调用的函数)、内存和/或动态提示进行了增强。
  • 提示链 - 多个LLM调用相互依赖,前一个LLM调用的输出会作为下一个调用的输入。
  • 路由 - LLM用于将应用程序路由至下一个合适的步骤或状态。
  • 并行性 - 该应用程序能够并行执行多个步骤或动作。
  • 编排 - 采用LLM的层级结构来协调底层动作与LLM运作。
  • 反思 - LLM用于反思和验证先前步骤或LLM调用的输出结果,这些结果可用来引导应用程序进入下一个合适的步骤或状态。

在LlamaIndex中,您可以通过使用Workflow类用于协调一系列步骤和LLMs。了解更多关于工作流程的信息。

4. 代理 #

我们将agent定义为"agentic application"的一个具体实例。agent是一种软件,它通过将LLM与其他工具及记忆系统相结合,在一个决定下一步使用何种工具(如有需要)的推理循环中协调运作,从而半自主地执行任务。

在实际操作中,这意味着:

  • 代理接收用户消息
  • 代理利用LLM,结合之前的聊天记录、工具和最新用户消息,决定下一步应采取的行动
  • 代理可能调用一个或多个工具来协助处理用户请求
  • 如果使用了工具,代理会解析工具输出,并据此决定后续行动
  • 当代理停止采取行动时,会将最终结果返回给用户

你可以了解更多关于agents的信息。

5. 检索增强生成(RAG) #

检索增强生成(RAG)是利用LlamaIndex构建数据驱动型LLM应用的核心技术。它通过查询时向LLM提供私有数据(而非基于数据训练LLM),使LLM能够回答关于您私有数据的问题。为避免发送全部数据给LLM,RAG会对数据进行索引,并仅选择性地将与查询相关的部分数据一同发送。了解更多关于RAG的信息。

6. 用例 #

基于数据的LLM应用有无尽的使用场景,但大致可归为四类:

6.1 代理 #

代理是一种由LLM驱动的自动化决策者,它通过一组工具与世界交互。代理能够采取任意数量的步骤来完成给定任务,动态决定最佳行动方案,而非遵循预设步骤。这使其具备额外的灵活性,能够应对更复杂的任务。

6.2 工作流程 #

LlamaIndex中的Workflow是一种特定的事件驱动抽象,它允许你编排一系列步骤和LLM调用。Workflow可用于实现任何智能代理应用,是LlamaIndex的核心组件。

6.3 结构化数据提取 #

Pydantic提取器允许您指定从数据中提取的精确数据结构,并利用LLMs以类型安全的方式填充缺失部分。这一功能对于从PDF、网站等非结构化来源提取结构化数据非常有用,是实现工作流自动化的关键。

6.4 查询引擎 #

查询引擎是一个端到端的流程,让你能够对数据提出问题。它接收自然语言查询,并返回响应,同时附带检索并传递给LLM的参考上下文。

6.5 聊天引擎 #

聊天引擎是一个端到端的流程,用于与您的数据展开对话(支持多轮交互而不仅限于单次问答)。

访问验证

请输入访问令牌

Token不正确,请重新输入