Provider 配置指南¶

将 Hyper-Extract 配置为使用 OpenAI、阿里云百炼或本地 vLLM 部署。

统一示例¶

以下三个平台运行相同的提取任务，仅客户端配置（前 3 行）不同。

OpenAI¶

from hyperextract import create_client, AutoGraph

llm, emb = create_client("openai", api_key="sk-xxx")

阿里云百炼¶

from hyperextract import create_client, AutoGraph

llm, emb = create_client("bailian", api_key="sk-xxx")
# 或换模型: create_client("bailian:qwen3.6-plus", api_key="sk-xxx")

本地 vLLM¶

from hyperextract import create_client, AutoGraph

llm, emb = create_client(
    llm="vllm:Qwen3.5-9B@http://localhost:8000/v1",
    embedder="vllm:bge-m3@http://localhost:8001/v1",
    api_key="dummy",
)

提取任务（三个平台共用）¶

graph = AutoGraph(
    instruction="提取文本中的人物及其关系",
    llm_client=llm,
    embedder=emb,
    node_key_extractor=lambda n: n.name,
    edge_key_extractor=lambda e: (e.source, e.target, e.type),
    nodes_in_edge_extractor=lambda e: (e.source, e.target),
)

text = "张三创立了字节跳动，李四担任 CEO。"
graph.parse(text)
print(f"节点: {len(graph.nodes)}, 关系: {len(graph.edges)}")

CLI 等价配置¶

平台	命令
OpenAI	`he config init -p openai -k sk-xxx`
百炼	`he config init -p bailian -k sk-xxx`
vLLM	`he config init` → 选择「本地 vLLM」
混合部署（LLM=百炼 + Embedding=本地）	`he config llm -p bailian -k sk-xxx` + `he config embedder -p vllm -u http://localhost:8001/v1 -k dummy`

字符串简写格式¶

create_client() 支持紧凑的字符串语法，快速配置：

格式	示例	结果
`provider`	`"bailian"`	使用预设的 LLM + Embedding 默认值
`provider:model`	`"bailian:qwen3.6-plus"`	覆盖 LLM 模型，保留预设 Embedding
`provider:model@url`	`"vllm:Qwen3.5-9B@localhost:8000/v1"`	完整手动指定

使用配置文件¶

如果你偏好基于文件的配置，运行一次 he config init，然后使用 Template.create() 或 get_client()：

from hyperextract import get_client, AutoGraph

llm, emb = get_client()  # 读取 ~/.he/config.toml
graph = AutoGraph(..., llm_client=llm, embedder=emb)

另请参阅¶

Provider 系统与本地模型支持 — 完整兼容性表格和 vLLM 部署指南
CLI 配置参考 — 完整的 he config 命令参考