Transformers （ONNX）嵌入

这TransformersEmbeddingModel是一个EmbeddingModel使用选定的句子转换器在本地计算句子嵌入的实现。spring-doc.cadn.net.cn

您可以使用任何 HuggingFace 嵌入模型。spring-doc.cadn.net.cn

它使用预训练的 Transformer 模型，序列化为开放神经网络交换（ONNX）格式。spring-doc.cadn.net.cn

Deep Java 库和 Microsoft ONNX Java 运行时库用于运行 ONNX 模型并计算 Java 中的嵌入。spring-doc.cadn.net.cn

前提条件

要在 Java 中运行东西，我们需要将 Tokenizer 和 Transformer 模型序列化为ONNX格式。spring-doc.cadn.net.cn

使用 optimum-cli 序列化 - 实现此目的的一种快速方法是使用 optimum-cli 命令行工具。以下代码片段准备一个 python 虚拟环境，安装所需的包，并使用optimum-cli:spring-doc.cadn.net.cn

python3 -m venv venv
source ./venv/bin/activate
(venv) pip install --upgrade pip
(venv) pip install optimum onnx onnxruntime sentence-transformers
(venv) optimum-cli export onnx --model sentence-transformers/all-MiniLM-L6-v2 onnx-output-folder

该代码片段将 sentence-transformers/all-MiniLM-L6-v2 转换器导出到onnx-output-folder文件夹。后者包括tokenizer.json和model.onnx嵌入模型使用的文件。spring-doc.cadn.net.cn

代替全 MiniLM-L6-v2，您可以选择任何 huggingface 转换器标识符或提供直接文件路径。spring-doc.cadn.net.cn

自动配置

Spring AI 自动配置、入门模块的工件名称发生了重大变化。有关更多信息，请参阅升级说明。spring-doc.cadn.net.cn

Spring AI 为 ONNX Transformer 嵌入模型提供 Spring Boot 自动配置。要启用它，请将以下依赖项添加到项目的 Mavenpom.xml文件：spring-doc.cadn.net.cn

<dependency>
    <groupId>org.springframework.ai</groupId>
    <artifactId>spring-ai-starter-model-transformers</artifactId>
</dependency>

或 Gradlebuild.gradle构建文件。spring-doc.cadn.net.cn

dependencies {
    implementation 'org.springframework.ai:spring-ai-starter-model-transformers'
}

请参阅依赖项管理部分，将 Spring AI BOM 添加到构建文件中。请参阅 Artifact Repositories 部分，将这些存储库添加到您的构建系统中。

要配置它，请使用spring.ai.embedding.transformer.*性能。spring-doc.cadn.net.cn

例如，将此内容添加到 application.properties 文件中，以使用 intfloat/e5-small-v2 文本嵌入模型配置客户端：spring-doc.cadn.net.cn

spring.ai.embedding.transformer.onnx.modelUri=https://huggingface.co/intfloat/e5-small-v2/resolve/main/model.onnx
spring.ai.embedding.transformer.tokenizer.uri=https://huggingface.co/intfloat/e5-small-v2/raw/main/tokenizer.json

支持的属性的完整列表包括：spring-doc.cadn.net.cn

嵌入属性

现在，通过前缀spring.ai.model.embedding.spring-doc.cadn.net.cn

要启用，spring.ai.model.embedding=transformers（默认启用）spring-doc.cadn.net.cn

要禁用，spring.ai.model.embedding=none（或任何与转换器不匹配的值）spring-doc.cadn.net.cn

进行此更改是为了允许配置多个模型。spring-doc.cadn.net.cn

属性	描述	默认值
spring.ai.embedding.transformer.enabled（已删除且不再有效）spring-doc.cadn.net.cn	启用 Transformer Embedding 模型。spring-doc.cadn.net.cn	truespring-doc.cadn.net.cn
spring.ai.model.embeddingspring-doc.cadn.net.cn	启用 Transformer Embedding 模型。spring-doc.cadn.net.cn	变形金刚spring-doc.cadn.net.cn
spring.ai.embedding.transformer.tokenizer.urispring-doc.cadn.net.cn	ONNX 引擎创建的预训练 HuggingFaceTokenizer 的 URI（例如 tokenizer.json）。spring-doc.cadn.net.cn	onnx/全 MiniLM-L6-v2/tokenizer.jsonspring-doc.cadn.net.cn
spring.ai.embedding.transformer.tokenizer.optionsspring-doc.cadn.net.cn	HuggingFaceTokenizer 选项，例如 'addSpecialTokens'、'modelMaxLength'、'truncation'、'padding'、'maxLength'、'stride'、'padToMultipleOf'。留空以回退到默认值。spring-doc.cadn.net.cn	emptyspring-doc.cadn.net.cn
spring.ai.embedding.transformer.cache.enabledspring-doc.cadn.net.cn	启用远程资源缓存。spring-doc.cadn.net.cn	truespring-doc.cadn.net.cn
spring.ai.embedding.transformer.cache.目录spring-doc.cadn.net.cn	用于缓存远程资源的目录路径，例如 ONNX 模型spring-doc.cadn.net.cn	${java.io.tmpdir}/spring-ai-onnx-modelspring-doc.cadn.net.cn
spring.ai.embedding.transformer.onnx.modelUrispring-doc.cadn.net.cn	现有的预训练 ONNX 模型。spring-doc.cadn.net.cn	onnx/all-MiniLM-L6-v2/model.onnxspring-doc.cadn.net.cn
spring.ai.embedding.transformer.onnx.modelOutputNamespring-doc.cadn.net.cn	ONNX 模型的输出节点名称，我们将用于嵌入计算。spring-doc.cadn.net.cn	last_hidden_statespring-doc.cadn.net.cn
spring.ai.embedding.transformer.onnx.gpuDeviceIdspring-doc.cadn.net.cn	要执行的 GPU 设备 ID。仅当 >= 0 时适用。否则忽略。（需要额外的onnxruntime_gpu依赖项）spring-doc.cadn.net.cn	-1spring-doc.cadn.net.cn
spring.ai.embedding.transformer.metadata模式spring-doc.cadn.net.cn	指定文档内容和元数据的哪些部分将用于计算嵌入。spring-doc.cadn.net.cn	没有spring-doc.cadn.net.cn

属性

描述

默认值

spring.ai.embedding.transformer.enabled（已删除且不再有效）spring-doc.cadn.net.cn

启用 Transformer Embedding 模型。spring-doc.cadn.net.cn

truespring-doc.cadn.net.cn

spring.ai.model.embeddingspring-doc.cadn.net.cn

启用 Transformer Embedding 模型。spring-doc.cadn.net.cn

变形金刚spring-doc.cadn.net.cn

spring.ai.embedding.transformer.tokenizer.urispring-doc.cadn.net.cn

ONNX 引擎创建的预训练 HuggingFaceTokenizer 的 URI（例如 tokenizer.json）。spring-doc.cadn.net.cn

onnx/全 MiniLM-L6-v2/tokenizer.jsonspring-doc.cadn.net.cn

spring.ai.embedding.transformer.tokenizer.optionsspring-doc.cadn.net.cn

HuggingFaceTokenizer 选项，例如 'addSpecialTokens'、'modelMaxLength'、'truncation'、'padding'、'maxLength'、'stride'、'padToMultipleOf'。留空以回退到默认值。spring-doc.cadn.net.cn

emptyspring-doc.cadn.net.cn

spring.ai.embedding.transformer.cache.enabledspring-doc.cadn.net.cn

启用远程资源缓存。spring-doc.cadn.net.cn

truespring-doc.cadn.net.cn

spring.ai.embedding.transformer.cache.目录spring-doc.cadn.net.cn

用于缓存远程资源的目录路径，例如 ONNX 模型spring-doc.cadn.net.cn

${java.io.tmpdir}/spring-ai-onnx-modelspring-doc.cadn.net.cn

spring.ai.embedding.transformer.onnx.modelUrispring-doc.cadn.net.cn

现有的预训练 ONNX 模型。spring-doc.cadn.net.cn

onnx/all-MiniLM-L6-v2/model.onnxspring-doc.cadn.net.cn

spring.ai.embedding.transformer.onnx.modelOutputNamespring-doc.cadn.net.cn

ONNX 模型的输出节点名称，我们将用于嵌入计算。spring-doc.cadn.net.cn

last_hidden_statespring-doc.cadn.net.cn

spring.ai.embedding.transformer.onnx.gpuDeviceIdspring-doc.cadn.net.cn

要执行的 GPU 设备 ID。仅当 >= 0 时适用。否则忽略。（需要额外的onnxruntime_gpu依赖项）spring-doc.cadn.net.cn

-1spring-doc.cadn.net.cn

spring.ai.embedding.transformer.metadata模式spring-doc.cadn.net.cn

指定文档内容和元数据的哪些部分将用于计算嵌入。spring-doc.cadn.net.cn

没有spring-doc.cadn.net.cn

错误和特殊情况

如果您看到类似Caused by: ai.onnxruntime.OrtException: Supplied array is ragged,..，您还需要在application.properties如下：spring-doc.cadn.net.cn

spring.ai.embedding.transformer.tokenizer.options.padding=true

如果您收到类似The generative output names don’t contain expected: last_hidden_state. Consider one of the available model outputs: token_embeddings, ….，则需要根据模型将模型输出名称设置为正确的值。考虑错误消息中列出的名称。例如：spring-doc.cadn.net.cn

spring.ai.embedding.transformer.onnx.modelOutputName=token_embeddings

如果您收到类似ai.onnxruntime.OrtException: Error code - ORT_FAIL - message: Deserialize tensor onnx::MatMul_10319 failed.GetFileLength for ./model.onnx_data failed:Invalid fd was supplied: -1, 这意味着您的模型大于 2GB，并在两个文件中序列化：model.onnx和model.onnx_data.spring-doc.cadn.net.cn

这model.onnx_data称为 External Data，并且应位于model.onnx.spring-doc.cadn.net.cn

目前唯一的解决方法是复制大型model.onnx_data在运行 Boot 应用程序的文件夹中。spring-doc.cadn.net.cn

如果您收到类似ai.onnxruntime.OrtException: Error code - ORT_EP_FAIL - message: Failed to find CUDA shared provider, 这意味着您正在使用 GPU 参数spring.ai.embedding.transformer.onnx.gpuDeviceId，但缺少onnxruntime_gpu依赖项。spring-doc.cadn.net.cn

<dependency>
    <groupId>com.microsoft.onnxruntime</groupId>
    <artifactId>onnxruntime_gpu</artifactId>
</dependency>

请根据CUDA版本（ONNX Java Runtime）选择合适的onnxruntime_gpu版本。spring-doc.cadn.net.cn

手动配置

如果您没有使用 Spring Boot，则可以手动配置 Onnx Transformers 嵌入模型。为此，将spring-ai-transformers对项目 Maven 的依赖pom.xml文件：spring-doc.cadn.net.cn

<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-transformers</artifactId>
</dependency>

请参阅依赖项管理部分，将 Spring AI BOM 添加到构建文件中。

然后创建一个新的TransformersEmbeddingModel实例，并使用setTokenizerResource(tokenizerJsonUri)和setModelResource(modelOnnxUri)方法来设置导出的tokenizer.json和model.onnx文件。(classpath:,file:或https:支持 URI 架构）。spring-doc.cadn.net.cn

如果未显式设置模型，TransformersEmbeddingModel默认为 sentence-transformers/all-MiniLM-L6-v2：spring-doc.cadn.net.cn

尺寸spring-doc.cadn.net.cn

384spring-doc.cadn.net.cn

平均性能spring-doc.cadn.net.cn

58.80spring-doc.cadn.net.cn

速度spring-doc.cadn.net.cn

14200 句话/秒spring-doc.cadn.net.cn

大小spring-doc.cadn.net.cn

80MBspring-doc.cadn.net.cn

以下代码片段说明了如何使用TransformersEmbeddingModel手动下载：spring-doc.cadn.net.cn

TransformersEmbeddingModel embeddingModel = new TransformersEmbeddingModel();

// (optional) defaults to classpath:/onnx/all-MiniLM-L6-v2/tokenizer.json
embeddingModel.setTokenizerResource("classpath:/onnx/all-MiniLM-L6-v2/tokenizer.json");

// (optional) defaults to classpath:/onnx/all-MiniLM-L6-v2/model.onnx
embeddingModel.setModelResource("classpath:/onnx/all-MiniLM-L6-v2/model.onnx");

// (optional) defaults to ${java.io.tmpdir}/spring-ai-onnx-model
// Only the http/https resources are cached by default.
embeddingModel.setResourceCacheDirectory("/tmp/onnx-zoo");

// (optional) Set the tokenizer padding if you see an errors like:
// "ai.onnxruntime.OrtException: Supplied array is ragged, ..."
embeddingModel.setTokenizerOptions(Map.of("padding", "true"));

embeddingModel.afterPropertiesSet();

List<List<Double>> embeddings = this.embeddingModel.embed(List.of("Hello world", "World is big"));

如果您创建TransformersEmbeddingModel手动时，您必须调用afterPropertiesSet()方法。

第一个embed()调用下载大型 ONNX 模型并将其缓存在本地文件系统上。因此，第一次调用可能需要比平时更长的时间。使用#setResourceCacheDirectory(<path>)方法，将 ONNX 模型存储为本地文件夹。默认缓存文件夹为${java.io.tmpdir}/spring-ai-onnx-model.spring-doc.cadn.net.cn

将 TransformersEmbeddingModel 创建为Bean. 那么你不必调用afterPropertiesSet()手动下载。spring-doc.cadn.net.cn

@Bean
public EmbeddingModel embeddingModel() {
   return new TransformersEmbeddingModel();
}

Transformers （ONNX） 嵌入

前提条件

自动配置

嵌入属性

错误和特殊情况

手动配置

Transformers （ONNX）嵌入