故障排除¶
常见问题的解决方案。
安装问题¶
pip 安装失败¶
问题:安装时出现错误
解决方案:
1. 升级 pip:pip install --upgrade pip
2. 使用 Python 3.11+:python --version
3. 在虚拟环境中安装:
ImportError: No module named 'hyperextract'¶
问题:安装后无法导入
解决方案:
1. 检查 Python 版本:python --version(需要 3.11+)
2. 验证安装:pip list | grep hyper
3. 检查虚拟环境是否已激活
4. 重新安装:pip install --force-reinstall hyperextract
配置问题¶
API 密钥未找到¶
错误:No API key configured
解决方案:
-
CLI 配置(推荐):
-
环境变量:
-
验证配置:
API 密钥无效¶
错误:Authentication failed
解决方案: 1. 验证密钥是否正确 2. 检查是否有额外的空格 3. 尝试在 OpenAI 控制台重新生成密钥 4. 检查密钥是否有可用额度
运行问题¶
模板未找到¶
错误:Template 'xxx' not found
解决方案:
-
列出可用模板:
-
检查拼写:
-
使用 Python 搜索:
需要指定语言¶
错误:--lang is required
解决方案:
注意:方法模板不需要语言参数。
输出目录已存在¶
错误:Output directory already exists
解决方案:
-
强制覆盖:
-
使用不同目录:
-
删除现有目录:
索引和搜索问题¶
索引未找到¶
错误:Search index not built
解决方案:
搜索返回空结果¶
问题:he search 找不到结果
解决方案:
-
验证索引是否存在:
-
尝试不同的查询:
-
增加 top_k:
-
检查数据是否存在:
对话失败¶
错误:Chat failed: index not found
解决方案:
性能问题¶
提取速度非常慢¶
问题:处理时间过长
解决方案:
-
批量处理时跳过索引:
-
减少分块大小(Python):
-
减少工作线程(如果达到速率限制):
内存不足¶
问题:进程被终止或出现内存错误
解决方案:
-
处理更小的分块:
-
保存中间结果:
-
中间步骤不构建索引:
数据问题¶
没有提取到实体¶
问题:结果为空
解决方案:
-
检查输入文本:
-
尝试不同的模板:
-
检查语言:
知识库损坏¶
问题:无法加载或读取错误
解决方案:
-
检查文件结构:
-
验证 JSON:
-
重新提取:
仍有问题?¶
- 检查日志 — 查看详细的错误信息
- 更新到最新版本 —
pip install --upgrade hyperextract - 查看 GitHub Issues — github.com/yifanfeng97/hyper-extract/issues
- 创建新 issue — 包含错误消息和复现步骤
调试模式¶
启用详细输出:
import logging
logging.basicConfig(level=logging.DEBUG)
from hyperextract import Template
ka = Template.create("general/graph", "zh")
或在 CLI 配置中: