当前的代码相似度RAG召回仅仅支持代码的向量化召回,后续项目是否考虑增加:
(1)基于ATS分析后的代码切片?避免规则切分段落造成的语义割裂。
(2)增强语义检索:基于上下文函数调用的语义分析?除了RAG检索出来的代码片段外,把代码对应的类、函数调用关系也作为Prompt的一部分;
(3)增强关键字检索:基于代码关键词的检索,检索出来代码片段后,把代码对应的类、函数调用关系也作为Prompt的一部分;
一个可参考的项目是:
https://github.com/vitali87/code-graph-rag.git