2026/4/6 6:07:38
网站建设
项目流程
域名怎么建设网站,自建站有哪些,天津商城网站制作,网站的评测系统怎么做的任务#xff1a;各自把前期工作总结#xff0c;包括主要使用的模型或技术介绍#xff0c;附上博客链接。
1. BERT模型的改进
使用模型为bge-large模型替换bert。
bge模型#xff08;M3#xff09;以及BGE模型使用的预训练方法RetroMAE的具体技术介绍见#xff1a;《M3…任务各自把前期工作总结包括主要使用的模型或技术介绍附上博客链接。1. BERT模型的改进使用模型为bge-large模型替换bert。bge模型M3以及BGE模型使用的预训练方法RetroMAE的具体技术介绍见《M3-Embedding》汇报-CSDN博客将BERT模型替换为BGE模型之后由另一位同学在此基础上加入rerank模型进行重排序。之后将largererank模型与有数据库版本的心法系统进行整合。测试主要包含以下的不足rerank模型会出现多线程错误由于模型比较大计算速度很慢当带搜索框输入一条问题并删除再接着输入问题时会因为前端快速连续搜索导致多个请求同时到达导致多线程并发问题。但是只要删掉问题等过一会模型就会自动恢复。但是测试的结果展示rerank加入确实有助于问答对的匹配关于速度的问题模型加载缓慢代码运行启动时可能需要半小时。搜索框搜索稳定时可以需要5分钟时间。关于代码部分进行整合的过程中发现其实代码里面有一些逻辑问题。比如关于阈值问题由于rerank模型控制输出5条结果那么阈值的作用就显得没那么重要了那么就需要考虑删除的问题。还有一些比较细节的问题但是由于时间和测试比较麻烦因为启动时间很长的原因没有进行一一排除。但是总体来说代码是可以跑通的。2. 标签预测目前暂时使用利于语义来匹配标签预测将新添加的问答对进行一个相似度计算计算出最相似的问答对将最相似的问答对的标签赋给新进来的问答对。具体使用的逻辑如下计算问题与知识库中所有问题的相似度取最相似的5个问题。统计这5个问题中每个一级标签的权重权重为所有属于该一级标签的问题的相似度之和。选择权重最高的一级标签。然后针对该一级标签统计这5个问题中属于该一级标签的问题的二级标签每个二级标签的权重为包含它的问题的相似度之和。选择权重最高的1-3个二级标签如果不足3个则全部选择如果超过3个选前3个。利用上面逻辑来保证一级标签和二级标签的从属关系。上面方法的不足如下如果数据集中没有与新问题相似的问题那么预测可能不准确。如果数据集中存在错误标签也会影响预测结果。