Skip to content

v0.3.5.dev1

Compare
Choose a tag to compare
@zgqgit zgqgit released this 14 Sep 15:53
· 271 commits to main since this release
86a8981

BISHENG 0.3.5 dev1 版

  1. 新增知识库分段管理功能:支持预览文档分段结果,支持对照原文件修改分段结果,分段结果支持搜索、删除等管理功能(在部署 OCR SDK 情况下,支持通过在原文件上圈选文本框来快速修改分段内容,需要使用SDK 2.4.3版本)>>知识库
    飞书20240914-234751

  2. 知识库文档支持自定义正则表达式切分策略,支持通过正则设置“第x章”、“第x条”等具有语义属性的切分策略。

  3. 助手/技能增加对外发布页面:支持快速复制调用接口的代码、发布为独立页面以及嵌入到第三方网站中。>>发布助手:API 接口、独立页面以及嵌入到第三方网站发布技能

20240914-235019
20240914-235054

  1. 当前除了调用助手与技能的接口,还提供了知识库相关接口,对该接口进行了升级,修复通过接口创建的知识库在角色授权列表不可见问题。升级后旧接口将失效,更新后的接口文档>>接口文档
    known issue:
  • 目前 OCR SDK 2.4.3 版本默认配置对于英文扫描文档识别解析时不会返回英文空格,如关注此类场景的朋友,可联系我们获取修改配置的方法。
  • Markdown无法表达合并单元格,所以对于有合并单元格的表格在切分结果的展示时有问题(OCR SDK表格识别的效果体验:https://www.dataelem.com/example/view?type=table 使用方法见下图),目前正在讨论方案,对于表格后面可能会选择html或latex等方式表示(需要同时考虑对大模型问答效果的影响,有经验的朋友欢迎贡献建议)。

飞书20240914-235135