老王小说

手机浏览器扫描二维码访问

第337章 噢(第2页)

先前有讲到了,我们来检测针对专业领域的大模型的标准就是检测是否有能力回答专业领域的问题,并针对结果进行优化。

这里我向chatbot提出同一个问题。

只采用大语言模型,采用知识库与大语言模型结合,和联网搜索与大语言模型结合。

三种功能下获得的回答是完全不同的,后面两个检索功能均为大语言模型优化了生成回答的准确性,对大语言模型的专业领域知识做了补充和改善。

可以看到普通的大语言模型回答的是最简短的,采用了知识库的回答,将答案细分,扩充,并添加了新的内容,附上参考文献。

最后的联网搜索,将答案分为了几类,更加全面,但是每类回答点到即止。

最后就是向量知识库进行优化。

对于准确率低的查询,分析模型回应错误的原因。

如果是由于知识库中缺少相关信息,可以通过添加更多相关文档和数据来增强向量知识库的覆盖范围。

用户反馈是对输入的问题和产生的回答进行记录,方便针对性进行调整。

反馈可以直接用于指导向量知识库的更新和优化。

不断地测试来完善我的专业领域大模型。

最后一部分是我本次研究的总结。

首先创建了一个能被大语言模型直接调用的专业知识库,在电力LCA这个专业性较高的领域填补了大语言模型的空白。

其次是采用RAG技术,将知识库,联网与大语言模型相结合,增强了大语言模型在特定领域的可信度和实用性。

最后就是本次研究虽然是针对电力LCA领域,但其背后的构架适用于各个领域,构建了一个完整的体系,可以进行修改,全方面的辅助大语言模型,应用广泛。

以下就是我的全部研究内容请各位老师批评指正。

3.3.2数据预处理

Unstructured库是一个强大的工具,专为处理非结构化数据设计,具体流程如图3.7所示,

如从文本文档、PDF文件或网页中提取数据。

它支持多种数据提取方法,包括正则表达式匹配、自

然语言处理(NLP)技术等。

数据预处理步骤如下:

本小章还未完,请点击下一页继续阅读后面精彩内容!

步骤一:数据清洗

去除杂质:从文本中去除无关的字符,如特殊符号、空白行等。

格式统一:将所有文本统一为相同的编码格式,通常为UTF-8,以避免编码错误。

热门小说推荐
女配有毒:男主大人,太贪吃

女配有毒:男主大人,太贪吃

顾筝为啥这么变态恶心,本宝宝要当媒人?还要被喂狗粮!系统任务不同!别BB。顾筝恶毒女配才是男女主感情催化剂!不要拦着本宝宝去虐渣!系统虐渣就虐渣,你动男女主做什么?顺便,谁让他们惹本宝宝了,控制不住我记几。顾筝悲催的被忽悠去做任务。这么变态又恶心的事情,为什么要她一个纯洁可爱的女孩子来做?不干了!收工,坐吃等死混日子。...

神豪:开局被熊孩子毁掉手办

神豪:开局被熊孩子毁掉手办

自家珍藏的手办被熊孩子毁了一地。想要讲道理,却被邻居大姐二十块钱打发。江小离欲哭无泪。叮,检测宿主觉醒无限暴击系统,今后的所有消费,将触发无限暴击。宿主损失珍藏级手办,损失金额三万元,触发系统五十倍暴击返现,您的银行卡入账一百五十万元。这不就有意思了。先来一辆迈巴赫宿主消费触发四十倍暴击,返利四千万布加迪威龙一辆!再给我来套别墅!宿主触发五十倍暴击,返利龙腾大厦写字楼一座!...

火影之忍界闪光

火影之忍界闪光

忍界被隐藏在深处的黑暗与阴谋笼罩,某个男人操纵着这一切。波风水门—木叶的金色闪光,将以光芒照耀忍界。如果我能够再一次遇见你,便没有能够将你从我身边夺走!十六年前的九尾事件,第四代火影波风水门阵亡,而当他再一次开始自己的人生之后,一切,又会发生怎样的改变?静若处子,动若飞雷神!!这便是,木叶的闪光。忍界的闪光...

新婚不甜蜜

新婚不甜蜜

新婚不甜蜜是郁菲精心创作的言情小说,恋上你看书网实时更新新婚不甜蜜最新章节并且提供无弹窗阅读,书友所发表的新婚不甜蜜评论,并不代表恋上你看书网赞同或者支持新婚不甜蜜读者的观点。...

无极剑神

无极剑神

天武大陆,宗门林立,弱肉强食,适者生存,为救亲人,苏云一念成魔,偶获逆天剑匣,习得惊世剑诀,一把由十万八千口仙剑镇压的神秘之剑,铸就了一段不朽剑神传说!...

最强废婿

最强废婿

父母双亡,却被亲叔叔卖到柳家当了倒插门的女婿。一个契机,打开瞳术,在这个弱肉强食的世界闯出一片天地!...

每日热搜小说推荐