手机浏览器扫描二维码访问
2.3
检索增强生成技术
rag(retrieval-augmented
generation)技术是一种结合了信息检索(retrieval)和文本生
成(generation)的自然语言处理(nlp)方法。核心思想是将传统的检索技术与现代的自然语言
生成技术相结合,以提高文本生成的准确性和相关性。它旨在通过从外部知识库中检索相关信息来
辅助大型语言模型(如
gpt
系列)生成更准确、可靠的回答。
在
rag
技术中,整个过程主要分为三个步骤如图
2.2
所示:索引(
indexing)、检索
(retrieval)和生成(generation)。首先,索引步骤是将大量的文档或数据集合进行预处理,将
其分割成较小的块(c混k)并进行编码,然后存储在向量数据库中。这个过程的关键在于将非结
构化的文本数据转化为结构化的向量表示,以便于后续的检索和生成步骤。接下来是检索步骤,它
根据输入的查询或问题,从向量数据库中检索出与查询最相关的前
k
个
c混k。这一步依赖于高效
的语义相似度计算方法,以确保检索到的
c混k
与查询具有高度的相关性。最后是生成步骤,它将
原始查询和检索到的
c混k
一起输入到预训练的
transformer
模型(如
gpt
或
bert)中,生成最
终的答案或文本。这个模型结合了原始查询的语义信息和检索到的相关上下文,以生成准确、连贯
且相关的文本。
rag
的概念和初步实现是由
douwe
穿成花瓶美人,反派老公破产了 逼我做妾?真太子为我入赘将军府 穿越明朝之我救了马皇后 武侠游戏:只有我知道剧情 八零守寡小娇娇,冷面糙汉被钓疯 我在修仙游戏世界中浑水摸鱼 七零大厂美人,改造反派崽暴富 空间通末世,我带飞全家很合理吧 京港月光 快穿:盘古居然是我哥 我在无限游戏中永生 凛冬末日:全民避难所求生 都市神医,开局扇醒拜金女 医林萧韵 我手握无限物资,砸出末世安全区 小马宝莉:星空之下 新来的转校生竟比校霸还野 沙雕攻以为他虐了白月光 跌落山崖的我,习得神级功法 七零娇美人,甩掉知青当首富
...
...
王虎穿越了,而且悲催的成了五指山下的一只老虎。我去,这是要做猴哥虎皮裙的节奏?王虎表示不服。作为一只21世纪穿越来的新时代老虎,怎么着也要和猴哥拜把子,做兄弟啊!此时此刻齐天大圣孙悟空被压五行山马上就满五百年,再有十年,波澜壮阔,影响三界格局的西天取经之旅就要开始,看王虎如何在其中搅动三界风云,与猴哥一起再掀万...
余庆阳一个搬砖二十年的老工程,梦回世纪之交,海河大学毕业,接老爸的班继续搬砖。用两辈子的行动告诉老师,搬砖不是因为我学习不好!是我命中注定要搬砖已有两本百万字完本书超级村主任最强退伍兵,可以放心入坑!大国工程书友群,群聊号码492691021新书重生之大国工匠...
...
甜宠无虐+日更+萌宝+智脑一个大佬和重生来的小媳妇甜蜜日常!一个娱乐小透明凭借智脑逆袭成超级影后的故事~...