手机浏览器扫描二维码访问
2.3
检索增强生成技术
rag(retrieval-augmented
generation)技术是一种结合了信息检索(retrieval)和文本生
成(generation)的自然语言处理(nlp)方法。核心思想是将传统的检索技术与现代的自然语言
生成技术相结合,以提高文本生成的准确性和相关性。它旨在通过从外部知识库中检索相关信息来
辅助大型语言模型(如
gpt
系列)生成更准确、可靠的回答。
在
rag
技术中,整个过程主要分为三个步骤如图
2.2
所示:索引(
indexing)、检索
(retrieval)和生成(generation)。首先,索引步骤是将大量的文档或数据集合进行预处理,将
其分割成较小的块(c混k)并进行编码,然后存储在向量数据库中。这个过程的关键在于将非结
构化的文本数据转化为结构化的向量表示,以便于后续的检索和生成步骤。接下来是检索步骤,它
根据输入的查询或问题,从向量数据库中检索出与查询最相关的前
k
个
c混k。这一步依赖于高效
的语义相似度计算方法,以确保检索到的
c混k
与查询具有高度的相关性。最后是生成步骤,它将
原始查询和检索到的
c混k
一起输入到预训练的
transformer
模型(如
gpt
或
bert)中,生成最
终的答案或文本。这个模型结合了原始查询的语义信息和检索到的相关上下文,以生成准确、连贯
且相关的文本。
rag
的概念和初步实现是由
douwe
穿越明朝之我救了马皇后 八零守寡小娇娇,冷面糙汉被钓疯 我手握无限物资,砸出末世安全区 新来的转校生竟比校霸还野 医林萧韵 逼我做妾?真太子为我入赘将军府 七零娇美人,甩掉知青当首富 我在无限游戏中永生 快穿:盘古居然是我哥 七零大厂美人,改造反派崽暴富 沙雕攻以为他虐了白月光 穿成花瓶美人,反派老公破产了 空间通末世,我带飞全家很合理吧 武侠游戏:只有我知道剧情 小马宝莉:星空之下 我在修仙游戏世界中浑水摸鱼 凛冬末日:全民避难所求生 都市神医,开局扇醒拜金女 跌落山崖的我,习得神级功法 京港月光
余庆阳一个搬砖二十年的老工程,梦回世纪之交,海河大学毕业,接老爸的班继续搬砖。用两辈子的行动告诉老师,搬砖不是因为我学习不好!是我命中注定要搬砖已有两本百万字完本书超级村主任最强退伍兵,可以放心入坑!大国工程书友群,群聊号码492691021新书重生之大国工匠...
...
朱慈烺此贼比汉奸还奸,比额李自成还能蛊惑人心!闯王李自成立马虎牙山,遥望东南,感慨万千。慈烺此子忤逆不孝,奸诈凶残,简直是曹操再世,司马复生,让他当了皇帝,全天下的逆贼奸臣刁民一定会想念朕的!大明崇祯皇帝于明孝陵前,痛哭流涕。我冤枉啊!我洪承畴真的不是朱贼慈烺的内应,我对大清可是一片忠心啊!大清兵部...
苍茫大地,未来变革,混乱之中,龙蛇并起,谁是真龙,谁又是蟒蛇?或是天地众生,皆可成龙?朝廷,江湖门派,世外仙道,千年世家,蛮族,魔神,妖族,上古巫道,千百势力,相互纠缠,因缘际会。...
江湖日报讯肯麦郎连锁客栈享誉大明各府,其总部却是京城一家名为来福的小客栈。来福客栈在江湖上大名鼎鼎,即便费用高昂,上到各派掌门下到江湖游侠,都挤破脑袋想去来福客栈吃顿饭。记者有幸请到武林盟主,揭开来福客栈的秘密!来福客栈日常一幕少林方丈,你怎么吃饭不给钱啊?偶弥陀佛,出家人身无分文,这顿饭可否算作化缘?不行!武当掌门没钱吃饭,还在后院洗碗呢!你若不给钱,就去洗茅房!来福客栈日常二幕丐帮长老,瞧你样子就没钱吃饭,你来客栈干啥?听闻来福客栈可以拿东西抵押,我这里有本上乘的秘...
甜宠无虐+日更+萌宝+智脑一个大佬和重生来的小媳妇甜蜜日常!一个娱乐小透明凭借智脑逆袭成超级影后的故事~...