Files
WeKnora/docs/QA.md

5.4 KiB
Raw Blame History

常见问题

1. 如何查看日志?

docker compose logs -f app docreader postgres

2. 如何启动和停止服务?

# 启动服务
./scripts/start_all.sh

# 停止服务
./scripts/start_all.sh --stop

# 清空数据库
./scripts/start_all.sh --stop && make clean-db

3. 服务启动后无法正常上传文档?

通常是Embedding模型和对话模型没有正确被设置导致。按照以下步骤进行排查

  1. 查看.env配置中的模型信息是否配置完整其中如果使用ollama访问本地模型需要确保本地ollama服务正常运行同时在.env中的如下环境变量需要正确设置:
# LLM Model
INIT_LLM_MODEL_NAME=your_llm_model
# Embedding Model
INIT_EMBEDDING_MODEL_NAME=your_embedding_model
# Embedding模型向量维度
INIT_EMBEDDING_MODEL_DIMENSION=your_embedding_model_dimension
# Embedding模型的ID通常是一个字符串
INIT_EMBEDDING_MODEL_ID=your_embedding_model_id

如果是通过remote api访问模型则需要额外提供对应的BASE_URLAPI_KEY:

# LLM模型的访问地址
INIT_LLM_MODEL_BASE_URL=your_llm_model_base_url
# LLM模型的API密钥如果需要身份验证可以设置
INIT_LLM_MODEL_API_KEY=your_llm_model_api_key
# Embedding模型的访问地址
INIT_EMBEDDING_MODEL_BASE_URL=your_embedding_model_base_url
# Embedding模型的API密钥如果需要身份验证可以设置
INIT_EMBEDDING_MODEL_API_KEY=your_embedding_model_api_key

当需要重排序功能时需要额外配置Rerank模型具体配置如下

# 使用的Rerank模型名称
INIT_RERANK_MODEL_NAME=your_rerank_model_name
# Rerank模型的访问地址
INIT_RERANK_MODEL_BASE_URL=your_rerank_model_base_url
# Rerank模型的API密钥如果需要身份验证可以设置
INIT_RERANK_MODEL_API_KEY=your_rerank_model_api_key
  1. 查看主服务日志,是否有ERROR日志输出

4. 多模态功能显示无效的图片链接?

当使用多模态功能时,如果遇到图片无法显示或显示无效链接的问题,请按照以下步骤排查:

1. 确认多模态功能已正确配置

在知识库设置中开启高级设置 - 多模态功能,并在界面中配置相应的多模态模型。

2. 确认 MinIO 服务已启动

如果多模态功能配置使用的是 MinIO 存储,需要确保 MinIO 镜像已正确启动:

# 启动 MinIO 服务
docker-compose --profile minio up -d

# 或者启动完整服务(包括 MinIO、Jaeger、Neo4j、Qdrant
docker-compose --profile full up -d

3. 检查 MinIO Bucket 权限

确保 MinIO 对应的 bucket 具有正确的读写权限:

  1. 访问 MinIO 控制台:http://localhost:9001(默认端口)
  2. 使用 .env 中配置的 MINIO_ACCESS_KEY_IDMINIO_SECRET_ACCESS_KEY 登录
  3. 进入对应的 bucket检查并设置访问策略为公开读取公开读写

重要提示

  • Bucket 名称不要包含特殊字符(包括中文),建议使用小写字母、数字和连字符
  • 如果无法修改现有 bucket 的权限,可以在配置中填入一个不存在的 bucket 名称,本项目会自动创建对应的 bucket 并设置好正确的权限

4. 配置 MINIO_PUBLIC_ENDPOINT

docker-compose.yml 文件中,MINIO_PUBLIC_ENDPOINT 变量默认配置为 http://localhost:9000

重要提示:如果你需要从其他设备或容器访问图片,localhost 可能无法正常工作,需要将其替换为本机的实际 IP 地址:

5. 验证配置

完成以上配置后,重启相关服务:

docker-compose restart docreader app

然后查看文档解析模块日志,确认 OCR 和 Caption 是否正确解析:

docker-compose logs -f docreader

5. docreader 服务无法启动?

如果 docreader 服务启动失败,日志中出现类似以下信息:

2026-01-12 xx:xx:xx.xxx [no-req-id] INFO __main__ | Initializing OCR engine with backend: paddle
Initializing server logging

这通常是因为 PaddleOCR 启动失败导致的。

解决方案

docker-compose.yml 文件的 docreader 服务中,已经配置了 OCR_BACKEND 环境变量:

environment:
  - OCR_BACKEND=${OCR_BACKEND:-no_ocr}

然后重启 docreader 服务:

docker-compose restart docreader

注意:设置为 no_ocr 后,文档解析将不会使用 OCR 功能,这可能会影响图片和扫描文档的文字识别效果。

6. 如何使用数据分析功能?

在使用数据分析功能前,请确保智能体已配置相关工具:

  1. 智能推理:需在工具配置中勾选以下两个工具:

    • 查看数据元信息
    • 数据分析
  2. 快速问答智能体:无需手动选择工具,即可直接进行简单的数据查询操作。

注意事项与使用规范

  1. 支持的文件格式

    • 目前仅支持 CSV (.csv) 和 Excel (.xlsx, .xls) 格式的文件。
    • 对于复杂的 Excel 文件,如果读取失败,建议将其转换为标准的 CSV 格式后重新上传。
  2. 查询限制

    • 仅支持 只读查询,包括 SELECT, SHOW, DESCRIBE, EXPLAIN, PRAGMA 等语句。
    • 禁止执行任何修改数据的操作,如 INSERT, UPDATE, DELETE, CREATE, DROP 等。

P.S.

如果以上方式未解决问题请在issue中描述您的问题并提供必要的日志信息辅助我们进行问题排查