← 返回首页

语义合并与增量扩充的文件融合方案

发布时间: 2026-06-03 19:40(北京时间)

摘要: 用户提出一种基于语义的增量文件合并方案,主文件A与多个子文件Bn通过LLM API逐步合并,需处理新增、勘误和精简,但面临长度限制和精度下降的挑战,期望实现可不断扩充的修正更新。

标签: 语义合并, 增量更新, 文件融合, LLM应用, 技术思考, 问题探讨

字数: 367

原文链接: /7402396589/R2r715mgj

现有文件A和文件B1、B2…Bn,文件A的作用相当于是“主要文件”,而Bn文件是需要通过LLM API汇入/合并到文件A中。

文件A和文件Bn都是一行行的条目,每行描述了一个事实或者观点。B的条目对于A来说可能是有新增的,可能是有勘误的,可能是需要精简合并的。

所以,如果只用LLM API的方式怎么让B1、B2…Bn慢慢汇入到文件A里面呢?

如果把A和B1发给LLM,让大模型合并,一开始可能还行,但后面受限于LLM的输出长度,精准度可能就慢慢下降了,而且A的字数可能就很容易遇到天花板。我希望A是可以不断扩充和修正的。

合并是基于语义的,比方说A里面写的一条是“小明在大连上班”,B3里有一条写的是“小明辞职了,现在去了山东找工作”,预期合起来是“小明之前在大连上班,辞职了后准备在山东找工作”

感觉有一点点难。