知识库是智能体输出回答的数据依据,适合有专业数据积累的开发者,以及对输出结果有准确性、专业性要求的开发者。
在知识库模块上传自己的数据,大模型与用户交互过程中,根据知识库中检索到的相似内容、大模型润色后生成结果,可以有效限定模型的生成范围。
文心智能体平台充分尊重和保障您专有的数据安全,不会使用提交的数据来训练或改进通用大模型,暂时未开放专属模型训练能力。
使用场景
- 零代码开发智能体时,引用知识库,限定检索范围;
- 低代码开发智能体时,引用知识库;
- 引用知识库,快捷开发数据插件。
知识库入口
入口1:登录平台后,点击左导航,即可进入知识库模块。
知识库创建
第一步:上传数据。
上传知识库数据有 3 种方式,①上传本地文件,②提交网页地址,③百度网盘导入。1 个账号可以创建 100 个知识库,全部知识库的总容量不能超过 1G,1 个知识库可以添加 100 个文件或网址,总容量不能超过 200M。
① 本地文件
- 当前仅支持文本和图片类型的文件,包括 txt、md、docx、pdf、xlsx、csv、png、jpg、jpeg 、m4a、mp3、mp4、mov格式,仅支持视频上传,暂不支持视频内容识别。
数据类型 | 拓展名 | 上传说明 |
文本 | text | 文件大小不超过 50M |
md | 文件大小不超过 50M | |
docx | 文件大小不超过 50M 暂不支持图文,文件中的图片会被过滤,仅保留文本 | |
pdf | 文件大小不超过 50M 暂不支持图文,文件中的图片会被过滤,仅保留文本 可以支持扫描文档,扫描文档页数不超过 50 页 | |
xlsx | 文件大小不超过 50M 数据类文件推荐上传 xlsx 格式,需注意为了保证 xlsx 格式文件分割后,模型也能理解数据含义,进行更加精准的数据查询与统计,上传的 xlsx 需包含表头 | |
csv | 文件大小不超过 50M | |
图片 | png | 30px ≤ 边长 ≤ 4096px,比例 3:1 以内,大小不能超过 20M 1 个知识库最多可以上传 500 张图片 图片中包含实体物品,识别结果更准确 |
jpg | 30px ≤ 边长 ≤ 4096px,比例 3:1 以内,大小不能超过 20M 1 个知识库集最多可以上传 500 张图片 图片中包含实体物品,识别结果更准确 | |
jpeg | 30px ≤ 边长 ≤ 4096px,比例 3:1 以内,大小不能超过 20M 1 个知识库最多可以上传 500 张图片 图片中包含实体物品,识别结果更准确 | |
音频 | m4a | 文件大小不超过 50M 通过智能识别,将音频转为文本 |
mp3 | 文件大小不超过 50M 通过智能识别,将音频转为文本 | |
视频 | mp4 | 文件大小不超过 200M 自动识别视频文件标题,并将标题内容作为视频标注,辅助模型召回视频内容 |
mov | 文件大小不超过 200M 自动识别视频文件标题,并将标题内容作为视频标注,辅助模型召回视频内容 |