pub_soft/WeKnora

Fork 0

mirror of https://github.com/Tencent/WeKnora.git synced 2026-06-04 13:30:32 +08:00

Files

Windfarer c1816fe6d6 add oidc

2026-03-30 11:13:44 +08:00

6.5 KiB

Raw Blame History

常见问题

1. 如何查看日志？

docker compose logs -f app docreader postgres

2. 如何启动和停止服务？

# 启动服务
./scripts/start_all.sh

# 停止服务
./scripts/start_all.sh --stop

# 清空数据库
./scripts/start_all.sh --stop && make clean-db

3. 服务启动后无法正常上传文档？

通常是Embedding模型和对话模型没有正确被设置导致。按照以下步骤进行排查

查看.env配置中的模型信息是否配置完整，其中如果使用ollama访问本地模型，需要确保本地ollama服务正常运行，同时在.env中的如下环境变量需要正确设置:

# LLM Model
INIT_LLM_MODEL_NAME=your_llm_model
# Embedding Model
INIT_EMBEDDING_MODEL_NAME=your_embedding_model
# Embedding模型向量维度
INIT_EMBEDDING_MODEL_DIMENSION=your_embedding_model_dimension
# Embedding模型的ID，通常是一个字符串
INIT_EMBEDDING_MODEL_ID=your_embedding_model_id

如果是通过remote api访问模型，则需要额外提供对应的BASE_URL和API_KEY:

# LLM模型的访问地址
INIT_LLM_MODEL_BASE_URL=your_llm_model_base_url
# LLM模型的API密钥，如果需要身份验证，可以设置
INIT_LLM_MODEL_API_KEY=your_llm_model_api_key
# Embedding模型的访问地址
INIT_EMBEDDING_MODEL_BASE_URL=your_embedding_model_base_url
# Embedding模型的API密钥，如果需要身份验证，可以设置
INIT_EMBEDDING_MODEL_API_KEY=your_embedding_model_api_key

当需要重排序功能时，需要额外配置Rerank模型，具体配置如下：

# 使用的Rerank模型名称
INIT_RERANK_MODEL_NAME=your_rerank_model_name
# Rerank模型的访问地址
INIT_RERANK_MODEL_BASE_URL=your_rerank_model_base_url
# Rerank模型的API密钥，如果需要身份验证，可以设置
INIT_RERANK_MODEL_API_KEY=your_rerank_model_api_key

查看主服务日志，是否有ERROR日志输出

4. 没有图片或者显示无效的图片链接？

当使用多模态功能时，如果遇到图片无法显示或显示无效链接的问题，请按照以下步骤排查：

1. 确认多模态功能已正确配置

在知识库设置中开启高级设置 - 多模态功能，并在界面中配置相应的多模态模型。

2. 确认 MinIO 服务已启动

如果多模态功能配置使用的是 MinIO 存储，需要确保 MinIO 镜像已正确启动：

# 启动 MinIO 服务
docker-compose --profile minio up -d

# 或者启动完整服务（包括 MinIO、Jaeger、Neo4j、Qdrant）
docker-compose --profile full up -d

3. 检查 MinIO Bucket 权限

确保 MinIO 对应的 bucket 具有正确的读写权限：

访问 MinIO 控制台：http://localhost:9001（默认端口）
使用 .env 中配置的 MINIO_ACCESS_KEY_ID 和 MINIO_SECRET_ACCESS_KEY 登录
进入对应的 bucket，检查并设置访问策略为公开读取或公开读写

重要提示：

Bucket 名称不要包含特殊字符（包括中文），建议使用小写字母、数字和连字符
如果无法修改现有 bucket 的权限，可以在配置中填入一个不存在的 bucket 名称，本项目会自动创建对应的 bucket 并设置好正确的权限

4. 配置 MINIO_PUBLIC_ENDPOINT

在 docker-compose.yml 文件中，MINIO_PUBLIC_ENDPOINT 变量默认配置为 http://localhost:9000。

重要提示：如果你需要从其他设备或容器访问图片，localhost 可能无法正常工作，需要将其替换为本机的实际 IP 地址：

5. 平台兼容性说明

重要提示：OCR_BACKEND=paddle 模式在部分平台上可能无法正常运行。如果遇到 PaddleOCR 启动失败的问题，请选择以下解决方案

方案一：关闭 OCR 识别

在 docker-compose.yml 文件的 docreader 服务中删除 OCR_BACKEND 配置，然后重启 docreader 服务

注意：设置为 no_ocr 后，文档解析将不会使用 OCR 功能，这可能会影响图片和扫描文档的文字识别效果。

方案二：使用外部 OCR 模型（推荐）

如果需要 OCR 功能，可以使用外部的视觉语言模型（VLM）来替代 PaddleOCR。在 docker-compose.yml 文件的 docreader 服务中配置：

environment:
  - OCR_BACKEND=vlm
  - OCR_API_BASE_URL=${OCR_API_BASE_URL:-}
  - OCR_API_KEY=${OCR_API_KEY:-}
  - OCR_MODEL=${OCR_MODEL:-}

然后重启 docreader 服务

优势：使用外部 OCR 模型可以获得更好的识别效果，且不受平台限制。

6. 如何使用数据分析功能？

在使用数据分析功能前，请确保智能体已配置相关工具：

智能推理：需在工具配置中勾选以下两个工具：
- 查看数据元信息
- 数据分析
快速问答智能体：无需手动选择工具，即可直接进行简单的数据查询操作。

注意事项与使用规范

支持的文件格式
- 目前仅支持 CSV (.csv) 和 Excel (.xlsx, .xls) 格式的文件。
- 对于复杂的 Excel 文件，如果读取失败，建议将其转换为标准的 CSV 格式后重新上传。
查询限制
- 仅支持 只读查询，包括 SELECT, SHOW, DESCRIBE, EXPLAIN, PRAGMA 等语句。
- 禁止执行任何修改数据的操作，如 INSERT, UPDATE, DELETE, CREATE, DROP 等。

7. 页面里刚保存的配置几秒后又消失了？

这类问题通常不是配置真的被系统清掉了，而是浏览器代理、缓存或插件干扰导致前端读到了异常响应，页面随后又被旧状态覆盖。

建议按下面顺序排查：

先关闭浏览器代理、抓包工具、自动改写请求的插件，再重新打开页面。
确认浏览器没有把 localhost 或当前访问域名走代理；如果配置了 PAC，请将 localhost、127.0.0.1 和实际部署域名加入直连名单。
强制刷新页面，或直接使用无痕窗口重新登录后再保存一次配置。
打开浏览器开发者工具的 Network 面板，确认保存配置相关请求返回的是最新内容，且没有被代理改写、缓存命中或重定向到其他环境。
如果是调试模式部署，可尝试重启 app 服务后再验证一次：

docker compose restart app

如果重启后短时间恢复正常，但再次访问又出现相同现象，仍应优先检查浏览器代理、缓存和多环境串连问题，而不是直接判断为后端配置丢失。

P.S.

如果以上方式未解决问题，请在issue中描述您的问题，并提供必要的日志信息辅助我们进行问题排查

6.5 KiB Raw Blame History Unescape Escape