RAG中“chunk大小”设得过大时,更常见的风险是()
召回条数会变少,向量库无法返回足够文档
单个chunk噪声与无关信息更多,生成更容易抓不住重点
重排模型会自动失效,无法对候选chunk打分
向量embedding会被截断,导致向量维度发生变化