af su
|
b9827529aa
|
fix: incorrect variable usage in update_doc_by_ids method (#4048)
Co-authored-by: saf <saf@zjuici.com>
|
2024-05-20 14:44:02 +08:00 |
|
你的代码TT
|
2f2221ca47
|
Add document normalization in Chroma. (#3640)
|
2024-04-15 21:37:32 +08:00 |
|
iimm
|
253d4b9b9a
|
修复使用pgvector时get_doc_by_ids方法报错的bug及知识库文件删除后向量仍然存在的bug (#3407)
* 修复使用pgvector无法查询到document
* 修复使用pg/es向量库无法知识库删除文档后向量库并未删除对应记录的bug
|
2024-03-20 08:41:41 +08:00 |
|
zR
|
2756996125
|
更新zhipuai请求方式
|
2024-02-06 13:50:57 +08:00 |
|
fengyaojie
|
9c5aa5bf2f
|
修复es 知识库查询bug (#2848)
|
2024-02-05 16:28:23 +08:00 |
|
fengyaojie
|
36956520ea
|
修复es 知识库查询bug (#2848)
|
2024-02-03 18:01:54 +08:00 |
|
zqt
|
cbfbbe5e6b
|
修复milvus相关bug
|
2024-01-30 21:28:42 +08:00 |
|
zR
|
042a70c09a
|
更新了chromadb的打印的符号
|
2024-01-30 14:18:14 +08:00 |
|
showmecodett
|
0c465faf8b
|
perf delete unused import
|
2024-01-29 06:09:59 +08:00 |
|
showmecodett
|
c94938bc83
|
Support Chroma
|
2024-01-29 05:52:52 +08:00 |
|
zR
|
56d32a9908
|
删除掉一些没用的注释,已经不需要todo了
|
2024-01-22 13:42:52 +08:00 |
|
zR
|
8ac255fc55
|
Merge branch 'chatchat-space:dev' into dev
|
2024-01-22 11:46:46 +08:00 |
|
showmecodett
|
71deed93df
|
perf typing
|
2024-01-21 21:00:12 +08:00 |
|
showmecodett
|
3057c29e47
|
perf typing
|
2024-01-21 20:56:26 +08:00 |
|
zR
|
8c2019f8b9
|
pr 2775 maybe need?
|
2024-01-20 22:20:02 +08:00 |
|
zR
|
4a77880ee1
|
Merge branch 'dev' of https://github.com/zRzRzRzRzRzRzR/Langchain-Chatchat into dev
|
2024-01-20 22:18:25 +08:00 |
|
zR
|
dc07cba1d4
|
更新依赖
|
2024-01-20 22:18:22 +08:00 |
|
zR
|
b058e1906f
|
Merge pull request #2704 from MSZheng20/dev
1、ES库index_name获取兼容windows和linux系统 2、补充mappings,创建向量索引结构保持一致 3、添加ES测试方法
|
2024-01-18 13:11:56 +08:00 |
|
zhengmingsheng
|
2ab944996e
|
fix:1、index_name获取兼容windows和linux系统 2、补充mappings,创建向量索引结构保持一致 3、添加ES向量库的测试方法
|
2024-01-18 11:25:27 +08:00 |
|
zR
|
e5acf3d2e6
|
Merge pull request #2688 from MSZheng20/dev
fix:修复ES库无法向量检索.添加mappings创建向量索引
|
2024-01-17 13:22:13 +08:00 |
|
zhengmingsheng
|
b2ea386f60
|
fix:修复ES库无法使用向量检索.添加mappings创建向量索引
|
2024-01-17 11:24:13 +08:00 |
|
lijia
|
2c92cd00ae
|
langchain新版本PGVector传入connection,插入、删除操作会回滚
|
2024-01-16 16:58:19 +08:00 |
|
lijia
|
67ae61d567
|
langchain新版本PGVector传入connection,插入、删除操作会回滚
|
2024-01-16 16:38:06 +08:00 |
|
zR
|
241690d593
|
更新运行数据库报错和项目里程碑
|
2024-01-14 10:46:41 +08:00 |
|
Lijia0
|
ff91508d8b
|
每次创建对象时从连接池获取连接,避免每次执行方法时都新建连接 (#2480)
|
2024-01-12 12:34:40 +08:00 |
|
xldistance
|
a5b52e1bd1
|
elasticsearch更新https连接 (#2390)
|
2024-01-12 10:17:28 +08:00 |
|
HALIndex
|
29ef5dda64
|
Update pgvector connection method following updates in langchain_community, to resolve the 'PGVector' object has no attribute 'connect' error. (#2591)
|
2024-01-12 10:17:04 +08:00 |
|
liunux4odoo
|
9ff7bef2c2
|
新功能:知识库管理界面支持查看、编辑、删除向量库文档 (#2471)
* 新功能:
- 知识库管理界面支持查看、编辑、删除向量库文档。暂不支持增加(aggrid添加新行比较麻烦,需要另外实现)
- 去除知识库管理界面中重建知识库和删除知识库按钮,建议用户到终端命令操作
修复:
- 所有与知识库名称、文件名称有关的数据库操作函数都改成大小写不敏感,所有路径统一为 posix 风格,避免因路径文本不一致导致数据重复和操作失效 (close #2232)
开发者:
- 添加 update_docs_by_id 函数与 API 接口。当前仅支持 FAISS,暂时未用到,未将来对知识库做更细致的修改做准备
- 统一 DocumentWithScore 与 DocumentWithVsId
- FAISS 返回的 Document.metadata 中包含 ID, 方便后续查找比对
- /knowledge_base/search_docs 接口支持 file_name, metadata 参数,可以据此检索文档
* fix bug
|
2023-12-26 13:44:36 +08:00 |
|
xldistance
|
332e1ccfaa
|
更新self.dims_length赋值错误 (#2380)
|
2023-12-14 19:56:39 +08:00 |
|
hzg0601
|
db008c1af8
|
为milvus增加额外索引与搜索配置
|
2023-12-13 15:52:11 +08:00 |
|
hzg0601
|
db1c1e2ee4
|
解决多次调用es创建索引失败的问题
|
2023-12-11 10:39:59 +08:00 |
|
liunux4odoo
|
7d2de47bcf
|
文件对话和知识库对话 API 接口实现全异步操作,防止阻塞 (#2256)
* EmbeddingFunAdapter 支持异步操作;文件对话和知识库对话 API 接口实现全异步操作,防止阻塞
* 修复: 使 list_files_from_folder 返回相对路径
|
2023-12-02 19:22:44 +08:00 |
|
glide-the
|
248db46187
|
Merge branch 'dev_summary' into dev_command_summary
实现summary_chunk 文档分段总结业务实现
使用 MapReduceDocumentsChain 生成摘要
# Conflicts:
# server/api.py
# server/knowledge_base/kb_doc_api.py
# server/knowledge_base/kb_service/base.py
# server/knowledge_base/migrate.py
|
2023-11-25 22:30:41 +08:00 |
|
liunux4odoo
|
aae4144476
|
数据库和向量库中文档 metadata["source"] 改为相对路径,便于向量库迁移 (#2153)
修复:
- 上传知识库文件名称包括子目录时,自动创建子目录
|
2023-11-23 19:54:00 +08:00 |
|
liunux4odoo
|
68a544ea33
|
开发者:XXKBService.get_doc_by_id 改为批量处理,提高访问向量库效率。
|
2023-11-16 11:09:40 +08:00 |
|
zR
|
94d4304638
|
更新了chatglm3 6b agent的文档,提示词 (#2041)
更新了chatglm3 6b agent的文档,提示词
修复代理no_proxy格式问题 #1838 的问题,感谢多次复现和验证
修改了pg清理知识库后还会引用之前知识库的问题
|
2023-11-13 16:30:09 +08:00 |
|
hzg0601
|
c1440c2609
|
增加ElasticSearch支持
|
2023-11-10 16:04:41 +08:00 |
|
liunux4odoo
|
b51ba11f45
|
支持通过配置项同时启动多个模型,将Wiki纳入samples知识库 (#2002)
新功能:
- 将 LLM_MODEL 配置项改为 LLM_MODELS 列表,同时启动多个模型
- 将 wiki 纳入 samples 知识库
依赖变化:
- 指定 streamlit~=1.27.0。1.26.0会报rerun错误,1.28.0会有无限刷新错误
修复优化:
- 优化 get_default_llm_model 逻辑
- 适配 Qwen 在线 API 做 Embeddings 时最大 25 行的限制
- 列出知识库磁盘文件时跳过 . 开头的文件
|
2023-11-09 22:15:52 +08:00 |
|
WilliamChen-luckbob
|
ce1001a043
|
bugfix:dev分支创建知识库必然失败的bug修复 (#1980)
* bugfix:dev分支创建知识库必然失败的bug修复
* 统一 KBServiceFactory.get_service_by_name 的逻辑,数据库中不存在知识库时返回 None
---------
Co-authored-by: liunux4odoo <liunux@qq.com>
|
2023-11-09 17:45:21 +08:00 |
|
liunux4odoo
|
65592a45c3
|
支持在线 Embeddings, Lite 模式支持所有知识库相关功能 (#1924)
新功能:
- 支持在线 Embeddings:zhipu-api, qwen-api, minimax-api, qianfan-api
- API 增加 /other/embed_texts 接口
- init_database.py 增加 --embed-model 参数,可以指定使用的嵌入模型(本地或在线均可)
- 对于 FAISS 知识库,支持多向量库,默认位置:{KB_PATH}/vector_store/{embed_model}
- Lite 模式支持所有知识库相关功能。此模式下最主要的限制是:
- 不能使用本地 LLM 和 Embeddings 模型
- 知识库不支持 PDF 文件
- init_database.py 重建知识库时不再默认情况数据库表,增加 clear-tables 参数手动控制。
- API 和 WEBUI 中 score_threshold 参数范围改为 [0, 2],以更好的适应在线嵌入模型
问题修复:
- API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息,导致第二轮API请求错误
开发者:
- 统一向量库的识别:以(kb_name,embed_model)为判断向量库唯一性的依据,避免 FAISS 知识库缓存加载逻辑错误
- KBServiceFactory.get_service_by_name 中添加 default_embed_model 参数,用于在构建新知识库时设置 embed_model
- 优化 kb_service 中 Embeddings 操作:
- 统一加载接口: server.utils.load_embeddings,利用全局缓存避免各处 Embeddings 传参
- 统一文本嵌入接口:server.knowledge_base.kb_service.base.[embed_texts, embed_documents]
- 重写 normalize 函数,去除对 scikit-learn/scipy 的依赖
|
2023-10-31 14:26:50 +08:00 |
|
liunux4odoo
|
deed92169f
|
支持在线 Embeddings:zhipu-api, qwen-api, minimax-api, qianfan-api (#1907)
* 新功能:
- 支持在线 Embeddings:zhipu-api, qwen-api, minimax-api, qianfan-api
- API 增加 /other/embed_texts 接口
- init_database.py 增加 --embed-model 参数,可以指定使用的嵌入模型(本地或在线均可)
问题修复:
- API 中 list_config_models 会删除 ONLINE_LLM_MODEL 中的敏感信息,导致第二轮API请求错误
开发者:
- 优化 kb_service 中 Embeddings 操作:
- 统一加载接口: server.utils.load_embeddings,利用全局缓存避免各处 Embeddings 传参
- 统一文本嵌入接口:server.embedding_api.[embed_texts, embed_documents]
|
2023-10-28 23:37:30 +08:00 |
|
zR
|
e74fe2d950
|
Zilliz修复 (#1874)
* 修复zilliz的问题
|
2023-10-25 21:59:26 +08:00 |
|
liunux4odoo
|
19f5f07d57
|
fix: unused imported faiss in milvus_kb_server (close #1849)
|
2023-10-24 15:01:19 +08:00 |
|
zR
|
69e5da4e7a
|
北京黑客松更新 (#1785)
* 北京黑客松更新
知识库支持:
支持zilliz数据库
Agent支持:
支持以下工具调用
1. 支持互联网Agent调用
2. 支持知识库Agent调用
3. 支持旅游助手工具(未上传)
知识库更新
1. 支持知识库简介,用于Agent选择
2. UI对应知识库简介
提示词选择
1. UI 和模板支持提示词模板更换选择
|
2023-10-18 15:19:02 +08:00 |
|
liunux4odoo
|
94977c7ab1
|
修复:切换embed_model时,FAISS向量库未正确释放,导致`d == self.d assert (#1766)
修复:
- 切换embed_model时,FAISS向量库未正确释放,导致d == self.d assert error (close [求助] 初始化知识库发生错误 #1657 )
- ApiRequest中chat接口增加max_tokens参数
- FileDocModel模型字段错误(字段错误 #1691)
|
2023-10-16 21:02:07 +08:00 |
|
liunux4odoo
|
1bae930691
|
修复faiss_pool知识库缓存key错误 (#1507)
|
2023-09-17 16:31:44 +08:00 |
|
liunux4odoo
|
c8d8727783
|
更新migrate.py和init_database.py,加强知识库迁移工具: (#1498)
1. 添加--update-in-db参数,按照数据库信息,从本地文件更新向量库
2. 添加--increament参数,根据本地文件增量更新向量库
3. 添加--prune-db参数,删除本地文件后,自动清理相关的向量库
4. 添加--prune-folder参数,根据数据库信息,清理无用的本地文件
5. 取消--update-info-only参数。数据库中存储了向量库信息,该操作意义不大
6. 添加--kb-name参数,所有操作支持指定操作的知识库,不指定则为所有本地知识库
7. 添加知识库迁移的测试用例
8. 删除milvus_kb_service的save_vector_store方法
|
2023-09-16 09:09:27 +08:00 |
|
liunux4odoo
|
f7c73b842a
|
优化configs (#1474)
* remove llm_model_dict
* optimize configs
* fix get_model_path
* 更改一些默认参数,添加千帆的默认配置
* Update server_config.py.example
|
2023-09-15 17:52:22 +08:00 |
|
唐国梁
|
6ad8aee88c
|
add ES function
|
2023-09-14 07:54:42 +08:00 |
|
liunux4odoo
|
a03b8d330d
|
升级到langchain==0.0.287,fschat==0.0.28;处理langchain.Milvus bug(#10492) (#1454)
* 修复milvus_kb_service中一些bug,添加文档后将数据同步到数据库
* 升级到langchain==0.0.287,fschat==0.0.28;处理langchain.Milvus bug(#10492)
* 修复切换模型BUG: 从在线API切换模型时出错
|
2023-09-13 08:43:11 +08:00 |
|