面试者背景¶
:::warning 30岁,中途转行的,2本,制造业外包,全干工程师,PLM平台、RAG客服(langchain4j)、人才信息平台,HR管理平台,都是单机项目
哪个项目做的时间长,或者最有亮点?
介绍下智能客服都做了哪些功能?JDK 17,langchain4j,RAGFlow(分词+embedding),flux。分词是怎么分的?ragflow默认的分段。分段效果你觉得怎么样?
PDF中如果有图片如何处理?OCR,召回无法支持图片?
RAG的完整流程是怎么样的?文档读取、分块、向量化、数据库、检索、混合检索
混合检索解决什么问题?
RAG检索效果不好,有哪些优化手段?语料,rerank、
介绍下什么是rerank?怎么做的重排?
如果用户问题不好,不会问,怎么办?HyDE知道么?
RAG的效果是什么?不能答非所问。准确率和召回率有啥区别?
Langchain4j帮你做了啥?和大模型交互,FunctionCall,
Langchain4j的function call的实现原理?模型的function call的原理?
@AiService的实现原理?低阶API&高阶API?
Langchain4j是你选型的吗?为啥用他?如果现在让你选你怎么选?spring ai Alibaba?
这个项目干了多久?你觉得还有哪些优化方向?模型、知识图谱、提示词优化。
提示词都做过哪些优化?防止prompt注入、生成流程图、few shot?
怎么防止prompt注入的?
用的哪个向量数据库?
向量相似度是怎么算的?余弦相似度、
介绍下transformer的原理?Attention机制、
:::