此版本仍在开发中,尚未被视为稳定版。为了获取最新的快照版本,请使用Spring AI 1.1.3spring-doc.cadn.net.cn

可观测性

Spring AI 基于 Spring 生态中的可观测性功能,为 AI 相关的运维提供洞察。spring-doc.cadn.net.cn

启用可观测性需要 spring-boot-actuator 模块。 将 Spring Boot Actuator 依赖项添加到项目的 Maven pom.xml 构建文件中:spring-doc.cadn.net.cn

<dependency>
 <groupId>org.springframework.boot</groupId>
 <artifactId>spring-boot-starter-actuator</artifactId>
</dependency>

或者添加到您的Gradle 构建脚本文件中。spring-doc.cadn.net.cn

dependencies {
    implementation 'org.springframework.boot:spring-boot-starter-actuator'
}

Spring AI 为其核心组件提供指标和跟踪功能: ChatClient(包括 Advisor), ChatModelEmbeddingModelImageModelVectorStorespring-doc.cadn.net.cn

低基数键将被添加到指标和跟踪中,而高基数键仅会被添加到跟踪中。

1.0.0-RC1 重大变更spring-doc.cadn.net.cn

以下配置属性已被重命名,以更好地反映其用途:spring-doc.cadn.net.cn

  • spring.ai.chat.client.observations.include-promptspring.ai.chat.client.observations.log-promptspring-doc.cadn.net.cn

  • spring.ai.chat.observations.include-promptspring.ai.chat.observations.log-promptspring-doc.cadn.net.cn

  • spring.ai.chat.observations.include-completionspring.ai.chat.observations.log-completionspring-doc.cadn.net.cn

  • spring.ai.image.observations.include-promptspring.ai.image.observations.log-promptspring-doc.cadn.net.cn

  • spring.ai.vectorstore.observations.include-query-responsespring.ai.vectorstore.observations.log-query-responsespring-doc.cadn.net.cn

ChatClient

当调用 ChatClient 的 call()stream() 操作时,会记录 spring.ai.chat.client 条观测。 它们用于测量执行调用所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

表 1. 低基数键
名称 描述

gen_ai.operation.namespring-doc.cadn.net.cn

始终 frameworkspring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

始终 spring_aispring-doc.cadn.net.cn

spring.ai.chat.client.streamspring-doc.cadn.net.cn

聊天模型的响应是否为流 - true or falsespring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 中的框架 API 类型: chat_clientspring-doc.cadn.net.cn

表 2. 高基数键
名称 描述

gen_ai.promptspring-doc.cadn.net.cn

通过聊天客户端发送的提示内容。可选。spring-doc.cadn.net.cn

spring.ai.chat.client.advisor.params (已弃用)spring-doc.cadn.net.cn

顾问参数映射。会话ID现在包含在spring.ai.chat.client.conversation.id中。spring-doc.cadn.net.cn

spring.ai.chat.client.advisorsspring-doc.cadn.net.cn

已配置的聊天客户端顾问列表。spring-doc.cadn.net.cn

spring.ai.chat.client.conversation.idspring-doc.cadn.net.cn

使用聊天记忆时的会话标识符。spring-doc.cadn.net.cn

spring.ai.chat.client.system.params (已弃用)spring-doc.cadn.net.cn

聊天客户端系统参数。可选。已被gen_ai.prompt取代。spring-doc.cadn.net.cn

spring.ai.chat.client.system.text (已弃用)spring-doc.cadn.net.cn

聊天客户端系统文本。可选。已被gen_ai.prompt取代。spring-doc.cadn.net.cn

spring.ai.chat.client.tool.function.names (已弃用)spring-doc.cadn.net.cn

启用的工具函数名称。已被 spring.ai.chat.client.tool.names 取代。spring-doc.cadn.net.cn

spring.ai.chat.client.tool.function.callbacks (已弃用)spring-doc.cadn.net.cn

已配置的聊天客户端函数回调列表。已被spring.ai.chat.client.tool.names取代。spring-doc.cadn.net.cn

spring.ai.chat.client.tool.namesspring-doc.cadn.net.cn

传递给聊天客户端的工具名称。spring-doc.cadn.net.cn

spring.ai.chat.client.user.params (已弃用)spring-doc.cadn.net.cn

聊天客户端用户参数。可选。已被gen_ai.prompt取代。spring-doc.cadn.net.cn

spring.ai.chat.client.user.text (已弃用)spring-doc.cadn.net.cn

聊天客户端用户文本。可选。已被gen_ai.prompt取代。spring-doc.cadn.net.cn

提示与完成数据

ChatClient 提示和补全数据通常较大,并且可能包含敏感信息。 出于这些原因,它默认不会被导出。spring-doc.cadn.net.cn

Spring AI 支持将提示和完成数据记录到日志中,以帮助调试和故障排除。spring-doc.cadn.net.cn

属性 描述 默认

spring.ai.chat.client.observations.log-promptspring-doc.cadn.net.cn

是否记录聊天客户端提示内容。spring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

spring.ai.chat.client.observations.log-completionspring-doc.cadn.net.cn

是否记录聊天客户端完成内容。spring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用聊天客户端提示和完成数据的日志记录,可能会存在泄露敏感或隐私信息的风险。请务必谨慎!

输入数据(已弃用)

spring.ai.chat.client.observations.include-input 属性已弃用,由 spring.ai.chat.client.observations.log-prompt 取代。请参阅 提示内容

输入数据ChatClient通常较大,并且可能包含敏感信息。 出于这些原因,它默认不会被导出。spring-doc.cadn.net.cn

Spring AI 支持将输入数据记录到日志中,以帮助调试和故障排除。spring-doc.cadn.net.cn

属性 描述 默认

spring.ai.chat.client.observations.include-inputspring-doc.cadn.net.cn

是否在观测中包含输入内容。spring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用在观测中包含输入内容的功能,可能会存在泄露敏感或隐私信息的风险。请务必谨慎!

聊天客户端顾问

当执行顾问时,会记录spring.ai.advisor个观测值。 它们用于测量顾问的耗时(包括在内部顾问上花费的时间),并传播相关的跟踪信息。spring-doc.cadn.net.cn

表 3. 低基数键
名称 描述

gen_ai.operation.namespring-doc.cadn.net.cn

始终 frameworkspring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

始终 spring_aispring-doc.cadn.net.cn

spring.ai.advisor.type (已弃用)spring-doc.cadn.net.cn

在请求处理过程中,顾问应用其逻辑的位置为 BEFOREAFTERAROUND 中的一个。自所有顾问始终属于同一类型以来,这一区分已不再适用。spring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 中的框架 API 类型: advisorspring-doc.cadn.net.cn

表 4. 高基数键
名称 描述

spring.ai.advisor.namespring-doc.cadn.net.cn

顾问的姓名。spring-doc.cadn.net.cn

spring.ai.advisor.orderspring-doc.cadn.net.cn

顾问链中的顾问顺序。spring-doc.cadn.net.cn

聊天模型

可观察性功能目前仅支持以下AI模型提供商的ChatModel个实现:Anthropic、Azure OpenAI、Mistral AI、Ollama、OpenAI、Vertex AI、MiniMax、Moonshot、QianFan、Zhipu AI。 未来版本将支持更多AI模型提供商。

调用 ChatModel 的 gen_ai.client.operation 观察结果是在调用 callstream 方法时记录的。 它们用于测量方法完成所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

The gen_ai.client.token.usage metrics measures number of input and output tokens used by a single model call.
表 5. 低基数键
名称 描述

gen_ai.operation.namespring-doc.cadn.net.cn

执行的操作名称。spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

由客户端仪表化标识的模型提供商。spring-doc.cadn.net.cn

gen_ai.request.modelspring-doc.cadn.net.cn

请求所针对的模型名称。spring-doc.cadn.net.cn

gen_ai.response.modelspring-doc.cadn.net.cn

生成响应的模型名称。spring-doc.cadn.net.cn

表 6. 高基数键
名称 描述

gen_ai.request.frequency_penaltyspring-doc.cadn.net.cn

模型请求的频率惩罚设置。spring-doc.cadn.net.cn

gen_ai.request.max_tokensspring-doc.cadn.net.cn

模型为一次请求生成的最大标记数。spring-doc.cadn.net.cn

gen_ai.request.presence_penaltyspring-doc.cadn.net.cn

模型请求的在场惩罚设置。spring-doc.cadn.net.cn

gen_ai.request.stop_sequencesspring-doc.cadn.net.cn

模型将用于停止生成更多标记的序列列表。spring-doc.cadn.net.cn

gen_ai.request.temperaturespring-doc.cadn.net.cn

模型请求的温度设置。spring-doc.cadn.net.cn

gen_ai.request.top_kspring-doc.cadn.net.cn

模型请求的 top_k 采样设置。spring-doc.cadn.net.cn

gen_ai.request.top_pspring-doc.cadn.net.cn

模型请求的 top_p 采样设置。spring-doc.cadn.net.cn

gen_ai.response.finish_reasonsspring-doc.cadn.net.cn

模型停止生成标记的原因,对应于每个接收到的生成结果。spring-doc.cadn.net.cn

gen_ai.response.idspring-doc.cadn.net.cn

AI 响应的唯一标识符。spring-doc.cadn.net.cn

gen_ai.usage.input_tokensspring-doc.cadn.net.cn

模型输入(提示)中使用的标记数量。spring-doc.cadn.net.cn

gen_ai.usage.output_tokensspring-doc.cadn.net.cn

模型输出(完成)中使用的标记数量。spring-doc.cadn.net.cn

gen_ai.usage.total_tokensspring-doc.cadn.net.cn

模型交换中使用的总标记数。spring-doc.cadn.net.cn

gen_ai.promptspring-doc.cadn.net.cn

发送给模型的完整提示。可选。spring-doc.cadn.net.cn

gen_ai.completionspring-doc.cadn.net.cn

模型返回的完整响应。可选。spring-doc.cadn.net.cn

spring.ai.model.request.tool.namesspring-doc.cadn.net.cn

请求中提供给模型的工具定义列表。spring-doc.cadn.net.cn

对于用户Tokens的度量,上表列出了观测跟踪中存在的值。 使用由ChatModel提供的指标名称gen_ai.client.token.usage

聊天提示与完成数据

聊天提示和完成数据通常较大,并且可能包含敏感信息。 出于这些原因,它们默认不会被导出。spring-doc.cadn.net.cn

Spring AI 支持记录聊天提示和完成数据,这对于故障排查场景非常有用。当跟踪功能可用时,日志将包含跟踪信息,以便更好地进行关联。spring-doc.cadn.net.cn

属性 描述 默认

spring.ai.chat.observations.log-promptspring-doc.cadn.net.cn

记录提示内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

spring.ai.chat.observations.log-completionspring-doc.cadn.net.cn

记录完成内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

spring.ai.chat.observations.include-error-loggingspring-doc.cadn.net.cn

在观测中包含错误日志。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用聊天提示和完成数据的日志记录,可能会存在泄露敏感或私人信息的风险。请务必谨慎!

工具调用

在聊天模型交互的上下文中执行工具调用时,会记录spring.ai.tool个观测值。这些观测值用于衡量工具调用完成所花费的时间,并传播相关的追踪信息。spring-doc.cadn.net.cn

表 7. 低基数键
名称 描述

gen_ai.operation.namespring-doc.cadn.net.cn

执行的操作名称。它始终为 frameworkspring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

负责该操作的提供者。它始终为 spring_aispring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 执行的操作类型。始终为 tool_callspring-doc.cadn.net.cn

spring.ai.tool.definition.namespring-doc.cadn.net.cn

工具的名称。spring-doc.cadn.net.cn

表 8. 高基数键

spring.ai.tool.definition.descriptionspring-doc.cadn.net.cn

该工具的描述。spring-doc.cadn.net.cn

spring.ai.tool.definition.schemaspring-doc.cadn.net.cn

调用该工具所使用的参数模式。spring-doc.cadn.net.cn

spring.ai.tool.call.argumentsspring-doc.cadn.net.cn

工具调用的输入参数。(仅在启用时)spring-doc.cadn.net.cn

spring.ai.tool.call.resultspring-doc.cadn.net.cn

用于调用该工具的参数架构。(仅在启用时)spring-doc.cadn.net.cn

工具调用参数和结果数据

默认情况下,工具调用的输入参数和结果不会被导出,因为它们可能具有敏感性。spring-doc.cadn.net.cn

Spring AI 支持将工具调用参数和结果数据导出为 Span 属性。spring-doc.cadn.net.cn

属性 描述 默认

spring.ai.tools.observations.include-contentspring-doc.cadn.net.cn

在观察中包含工具调用内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您在观测中启用工具调用参数和结果的包含,可能会存在泄露敏感或隐私信息的风险。请务必谨慎!

嵌入模型

可观察性功能目前仅支持以下 AI 模型提供商的 EmbeddingModel 个实现:Azure OpenAI、Mistral AI、Ollama 和 OpenAI。 未来版本将支持更多 AI 模型提供商。

gen_ai.client.operation 个观测记录在嵌入模型方法调用上。 它们用于测量方法完成所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

The gen_ai.client.token.usage metrics measures number of input and output tokens used by a single model call.
表 9. 低基数键
名称 描述

gen_ai.operation.namespring-doc.cadn.net.cn

执行的操作名称。spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

由客户端仪表化标识的模型提供商。spring-doc.cadn.net.cn

gen_ai.request.modelspring-doc.cadn.net.cn

请求所针对的模型名称。spring-doc.cadn.net.cn

gen_ai.response.modelspring-doc.cadn.net.cn

生成响应的模型名称。spring-doc.cadn.net.cn

表 10. 高基数键
名称 描述

gen_ai.request.embedding.dimensionsspring-doc.cadn.net.cn

生成的输出嵌入所具有的维度数量。spring-doc.cadn.net.cn

gen_ai.usage.input_tokensspring-doc.cadn.net.cn

模型输入中使用的标记数量。spring-doc.cadn.net.cn

gen_ai.usage.total_tokensspring-doc.cadn.net.cn

模型交换中使用的总标记数。spring-doc.cadn.net.cn

对于用户Tokens的度量,上表列出了观测跟踪中存在的值。 使用由EmbeddingModel提供的指标名称gen_ai.client.token.usage

图像模型

可观察性功能目前仅支持来自以下AI模型提供商的ImageModel个实现:OpenAI。 未来版本将支持更多AI模型提供商。

gen_ai.client.operation 个观测记录在图像模型方法调用上。 它们用于测量方法完成所花费的时间,并传播相关的跟踪信息。spring-doc.cadn.net.cn

The gen_ai.client.token.usage metrics measures number of input and output tokens used by a single model call.
表 11. 低基数键
名称 描述

gen_ai.operation.namespring-doc.cadn.net.cn

执行的操作名称。spring-doc.cadn.net.cn

gen_ai.systemspring-doc.cadn.net.cn

由客户端仪表化标识的模型提供商。spring-doc.cadn.net.cn

gen_ai.request.modelspring-doc.cadn.net.cn

请求所针对的模型名称。spring-doc.cadn.net.cn

表 12. 高基数键
名称 描述

gen_ai.request.image.response_formatspring-doc.cadn.net.cn

生成的图像返回的格式。spring-doc.cadn.net.cn

gen_ai.request.image.sizespring-doc.cadn.net.cn

要生成的图像大小。spring-doc.cadn.net.cn

gen_ai.request.image.stylespring-doc.cadn.net.cn

生成图像的样式。spring-doc.cadn.net.cn

gen_ai.response.idspring-doc.cadn.net.cn

AI 响应的唯一标识符。spring-doc.cadn.net.cn

gen_ai.response.modelspring-doc.cadn.net.cn

生成响应的模型名称。spring-doc.cadn.net.cn

gen_ai.usage.input_tokensspring-doc.cadn.net.cn

模型输入(提示)中使用的标记数量。spring-doc.cadn.net.cn

gen_ai.usage.output_tokensspring-doc.cadn.net.cn

模型输出(生成)中使用的标记数量。spring-doc.cadn.net.cn

gen_ai.usage.total_tokensspring-doc.cadn.net.cn

模型交换中使用的总标记数。spring-doc.cadn.net.cn

gen_ai.promptspring-doc.cadn.net.cn

发送给模型的完整提示。可选。spring-doc.cadn.net.cn

对于用户Tokens的度量,上表列出了观测跟踪中存在的值。 使用由ImageModel提供的指标名称gen_ai.client.token.usage

图像提示数据

图像提示数据通常较大,并且可能包含敏感信息。 出于这些原因,它不会默认导出。spring-doc.cadn.net.cn

Spring AI 支持记录图像提示数据,这对于故障排查场景非常有用。当跟踪功能可用时,日志将包含跟踪信息,以便更好地进行关联。spring-doc.cadn.net.cn

属性 描述 默认

spring.ai.image.observations.log-promptspring-doc.cadn.net.cn

记录图像提示内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果您启用图像提示数据的日志记录,可能会存在泄露敏感或隐私信息的风险。请务必谨慎!

向量商店

Spring AI 中的所有向量存储实现都已进行插桩,以通过 Micrometer 提供指标和分布式追踪数据。spring-doc.cadn.net.cn

观察结果db.vector.client.operation是在与向量存储交互时记录的。 它们用于测量在queryaddremove操作上花费的时间,并传播相关的追踪信息。spring-doc.cadn.net.cn

表 13. 低基数键
名称 描述

db.operation.namespring-doc.cadn.net.cn

正在执行的操作或命令的名称。取值为 adddeletequeryspring-doc.cadn.net.cn

客户端仪表化所识别的数据库管理系统(DBMS)产品。取值为 pg_vectorazurecassandrachromaelasticsearchmilvusneo4jopensearchqdrantredistypesenseweaviatepineconeoraclemongodbgemfirehanasimple 中的一个。spring-doc.cadn.net.cn

spring.ai.kindspring-doc.cadn.net.cn

Spring AI 中的框架 API 类型: vector_storespring-doc.cadn.net.cn

表 14. 高基数键
名称 描述

db.collection.namespring-doc.cadn.net.cn

数据库中的集合(表、容器)的名称。spring-doc.cadn.net.cn

数据库的名称,需在服务器地址和端口范围内完整指定。spring-doc.cadn.net.cn

如果存在,则为记录标识符。spring-doc.cadn.net.cn

db.search.similarity_metricspring-doc.cadn.net.cn

用于相似性搜索的指标。spring-doc.cadn.net.cn

db.vector.dimension_countspring-doc.cadn.net.cn

向量的维度。spring-doc.cadn.net.cn

db.vector.field_namespring-doc.cadn.net.cn

向量中的名称字段(例如,字段名称)。spring-doc.cadn.net.cn

db.vector.query.contentspring-doc.cadn.net.cn

正在执行的搜索查询内容。spring-doc.cadn.net.cn

db.vector.query.filterspring-doc.cadn.net.cn

搜索查询中使用的元数据过滤器。spring-doc.cadn.net.cn

db.vector.query.response.documentsspring-doc.cadn.net.cn

从相似性搜索查询中返回的文档。可选。spring-doc.cadn.net.cn

db.vector.query.similarity_thresholdspring-doc.cadn.net.cn

相似度阈值,用于接受所有搜索得分。阈值为 0.0 表示接受任何相似度,或禁用相似度阈值过滤。阈值为 1.0 表示需要完全匹配。spring-doc.cadn.net.cn

db.vector.query.top_kspring-doc.cadn.net.cn

查询返回的前 k 个最相似的向量。spring-doc.cadn.net.cn

响应数据

向量搜索的响应数据通常较大,并且可能包含敏感信息。 出于这些原因,它默认不会被导出。spring-doc.cadn.net.cn

Spring AI 支持记录向量搜索响应数据,这对于故障排查场景非常有用。当跟踪功能可用时,日志将包含跟踪信息,以便更好地进行关联。spring-doc.cadn.net.cn

属性 描述 默认

spring.ai.vectorstore.observations.log-query-responsespring-doc.cadn.net.cn

记录向量存储查询响应内容。truefalsespring-doc.cadn.net.cn

falsespring-doc.cadn.net.cn

如果启用了向量搜索响应数据的日志记录,可能会有泄露敏感或私人信息的风险。请务必小心!

更多指标参考

本节记录了Spring AI组件在Prometheus中显示的指标。spring-doc.cadn.net.cn

指标命名约定

Spring AI 使用 Micrometer。基础指标名称使用点号(例如,gen_ai.client.operation),Prometheus 会将其导出为带下划线和标准后缀的形式:spring-doc.cadn.net.cn

以下展示了基础指标名称如何扩展为 Prometheus 时间序列。spring-doc.cadn.net.cn

基础指标名称 导出的时间序列

gen_ai.client.operationspring-doc.cadn.net.cn

gen_ai_client_operation_seconds_count
gen_ai_client_operation_seconds_sum
gen_ai_client_operation_seconds_max
gen_ai_client_operation_active_countspring-doc.cadn.net.cn

db.vector.client.operationspring-doc.cadn.net.cn

db_vector_client_operation_seconds_count
db_vector_client_operation_seconds_sum
db_vector_client_operation_seconds_max
db_vector_client_operation_active_countspring-doc.cadn.net.cn

聊天客户端指标

指标名称 类型 单元 描述

gen_ai_chat_client_operation_seconds_sumspring-doc.cadn.net.cn

定时器spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

ChatClient 操作(调用/流)所花费的总时间spring-doc.cadn.net.cn

gen_ai_chat_client_operation_seconds_countspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

已完成的 ChatClient 操作数量spring-doc.cadn.net.cn

gen_ai_chat_client_operation_seconds_maxspring-doc.cadn.net.cn

仪表盘spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

ChatClient 操作的最大观测持续时间spring-doc.cadn.net.cn

gen_ai_chat_client_operation_active_countspring-doc.cadn.net.cn

仪表盘spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

当前正在进行的 ChatClient 操作数量spring-doc.cadn.net.cn

进行中与已完成: active_count 显示正在进行的调用;_seconds 系列仅反映已完成的调用。spring-doc.cadn.net.cn

聊天模型指标(模型提供商执行)

指标名称 类型 单元 描述

gen_ai_client_operation_seconds_sumspring-doc.cadn.net.cn

定时器spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

执行聊天模型操作的总时间spring-doc.cadn.net.cn

gen_ai_client_operation_seconds_countspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

已完成的聊天模型操作数量spring-doc.cadn.net.cn

gen_ai_client_operation_seconds_maxspring-doc.cadn.net.cn

仪表盘spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

聊天模型操作的最大观测持续时间spring-doc.cadn.net.cn

gen_ai_client_operation_active_countspring-doc.cadn.net.cn

仪表盘spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

当前正在进行的聊天模型操作数量spring-doc.cadn.net.cn

Tokens使用情况

指标名称 类型 单元 描述

gen_ai_client_token_usage_totalspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

Tokensspring-doc.cadn.net.cn

消耗的总Tokens数,按Tokens类型标记spring-doc.cadn.net.cn

标签

标签 含义

gen_ai_token_type=inputspring-doc.cadn.net.cn

发送给模型的提示词元spring-doc.cadn.net.cn

gen_ai_token_type=outputspring-doc.cadn.net.cn

模型返回的完成Tokensspring-doc.cadn.net.cn

gen_ai_token_type=totalspring-doc.cadn.net.cn

输入 + 输出spring-doc.cadn.net.cn

向量存储指标

指标名称 类型 单元 描述

db_vector_client_operation_seconds_sumspring-doc.cadn.net.cn

定时器spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

向量存储操作(添加/删除/查询)所花费的总时间spring-doc.cadn.net.cn

db_vector_client_operation_seconds_countspring-doc.cadn.net.cn

计数器spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

已完成的向量存储操作数量spring-doc.cadn.net.cn

db_vector_client_operation_seconds_maxspring-doc.cadn.net.cn

仪表盘spring-doc.cadn.net.cn

spring-doc.cadn.net.cn

向量存储操作的最大观测持续时间spring-doc.cadn.net.cn

db_vector_client_operation_active_countspring-doc.cadn.net.cn

仪表盘spring-doc.cadn.net.cn

计数spring-doc.cadn.net.cn

当前正在进行的向量存储操作数量spring-doc.cadn.net.cn

标签

标签 含义

db_operation_namespring-doc.cadn.net.cn

操作类型 (add, delete, query)spring-doc.cadn.net.cn

db_systemspring-doc.cadn.net.cn

向量数据库/提供商 (redis, chroma, pgvector, …)spring-doc.cadn.net.cn

spring_ai_kindspring-doc.cadn.net.cn

vector_storespring-doc.cadn.net.cn

理解进行中与已完成