跳转至

Provider 配置指南

将 Hyper-Extract 配置为使用 OpenAI、阿里云百炼或本地 vLLM 部署。


统一示例

以下三个平台运行相同的提取任务,仅客户端配置(前 3 行)不同。

OpenAI

from hyperextract import create_client, AutoGraph

llm, emb = create_client("openai", api_key="sk-xxx")

阿里云百炼

from hyperextract import create_client, AutoGraph

llm, emb = create_client("bailian", api_key="sk-xxx")
# 或换模型: create_client("bailian:qwen3.6-plus", api_key="sk-xxx")

本地 vLLM

from hyperextract import create_client, AutoGraph

llm, emb = create_client(
    llm="vllm:Qwen3.5-9B@http://localhost:8000/v1",
    embedder="vllm:bge-m3@http://localhost:8001/v1",
    api_key="dummy",
)

提取任务(三个平台共用)

graph = AutoGraph(
    instruction="提取文本中的人物及其关系",
    llm_client=llm,
    embedder=emb,
    node_key_extractor=lambda n: n.name,
    edge_key_extractor=lambda e: (e.source, e.target, e.type),
    nodes_in_edge_extractor=lambda e: (e.source, e.target),
)

text = "张三创立了字节跳动,李四担任 CEO。"
graph.parse(text)
print(f"节点: {len(graph.nodes)}, 关系: {len(graph.edges)}")

CLI 等价配置

平台 命令
OpenAI he config init -p openai -k sk-xxx
百炼 he config init -p bailian -k sk-xxx
vLLM he config init → 选择「本地 vLLM」
混合部署(LLM=百炼 + Embedding=本地) he config llm -p bailian -k sk-xxx + he config embedder -p vllm -u http://localhost:8001/v1 -k dummy

字符串简写格式

create_client() 支持紧凑的字符串语法,快速配置:

格式 示例 结果
provider "bailian" 使用预设的 LLM + Embedding 默认值
provider:model "bailian:qwen3.6-plus" 覆盖 LLM 模型,保留预设 Embedding
provider:model@url "vllm:Qwen3.5-9B@localhost:8000/v1" 完整手动指定

使用配置文件

如果你偏好基于文件的配置,运行一次 he config init,然后使用 Template.create()get_client()

from hyperextract import get_client, AutoGraph

llm, emb = get_client()  # 读取 ~/.he/config.toml
graph = AutoGraph(..., llm_client=llm, embedder=emb)

另请参阅