diff --git "a/tools/kbwf_image_content_enrich/1.0.0/\345\233\276\346\226\207.kbwf" "b/tools/kbwf_image_content_enrich/1.0.0/\345\233\276\346\226\207.kbwf" new file mode 100644 index 0000000..216141f Binary files /dev/null and "b/tools/kbwf_image_content_enrich/1.0.0/\345\233\276\346\226\207.kbwf" differ diff --git a/tools/kbwf_image_content_enrich/README.md b/tools/kbwf_image_content_enrich/README.md new file mode 100644 index 0000000..a1d92ea --- /dev/null +++ b/tools/kbwf_image_content_enrich/README.md @@ -0,0 +1,21 @@ +# 图文内容增强工作流 + +该 KBWF 工作流用于从文件中提取图片并进行图片理解,然后将图片理解内容插入回文档文本中,以便用户提问时可以命中图片中的关键信息。 + +## 功能 + +- 提取文件中的图片引用/图片资源 +- 调用视觉理解模型 API(例如 qwen-3.6)生成图片理解内容 +- 将图片理解内容插入到图片位置附近的文本中(尽量与图片保持同段) + +## 依赖 + +- MaxKB 平台 +- 视觉理解模型 API(例如 qwen-3.6)(如需 API Key,请在平台配置中设置,勿提交到仓库) + +## 使用说明(概述) + +1. 在 MaxKB 工具商店导入该工作流 +2. 配置视觉理解模型 API +3. 运行工作流处理包含图片的文档 +4. 在输出内容中检查是否插入了“图片理解:...” diff --git a/tools/kbwf_image_content_enrich/data.yaml b/tools/kbwf_image_content_enrich/data.yaml new file mode 100644 index 0000000..703ebce --- /dev/null +++ b/tools/kbwf_image_content_enrich/data.yaml @@ -0,0 +1,5 @@ +name: 图文内容增强工作流 +tags: + - 工作流模板 +title: 图文内容增强(图片理解插入) +description: 从文件中提取图片并调用视觉理解模型 API(如 qwen-3.6)生成图片理解文本,插入回文档以提升问答命中图片内容的能力。 diff --git a/tools/kbwf_image_content_enrich/logo.png b/tools/kbwf_image_content_enrich/logo.png new file mode 100644 index 0000000..40922dc Binary files /dev/null and b/tools/kbwf_image_content_enrich/logo.png differ