当前位置: 首页 > news >正文

设计开发建设网站济南专业网站制作

设计开发建设网站,济南专业网站制作,WordPress无刷新音乐,检测网站点击量论文链接#xff1a;2023.12-https://arxiv.org/pdf/2312.06185.pdf 1.Background Motivation 目前生成式的语言模型#xff0c;如ChatGPT等在通用领域获得了巨大的成功#xff0c;但在专业领域#xff0c;由于缺乏相关事实性知识#xff0c;LLM往往会产生不准确的… 论文链接2023.12-https://arxiv.org/pdf/2312.06185.pdf 1.Background Motivation 目前生成式的语言模型如ChatGPT等在通用领域获得了巨大的成功但在专业领域由于缺乏相关事实性知识LLM往往会产生不准确的回复即幻觉。许多研究人员企图通过外部知识注入提高LLM在专业领域的表现但许多最先进的llm都不是开源的这使得仅向模型api注入知识具有挑战性。 研究发现KGs中存储的大量事实知识有可能显著提高LLM反应的准确性所以解决上述问题的一个可行方法是将知识图KGs集成到LLM中。在此基础上本文提出了一个向LLM的进行黑盒知识注入框架KnowGPT。KnowGPT包括两部分①利用深度强化学习RL从知识图KGs中提取相关知识②并使用多臂赌博机MAB为每个问题选择最合适的路径抽取策略和提示。 现有的KGLMs的方法有很多 但许多最先进的LLM只能通过黑盒调用即只能通过提交文本输入来检索模型响应而无法访问模型细节。因而无法使用上述的白盒知识注入技术。尽管白盒方法可以应用于开源LLMs如BLOOM和LLaMA但由于更新模型权重往往会产生显著的计算成本。因此本文关注能否开发一个黑盒知识注入框架能够有效地将KG集成到仅使用API的LLM中 在解决该问题时需要关注两个挑战①如何检索KG②如何编码、利用检索到的信息。 2.问题定义 给定一个问题上下文 Q { Q s , Q t } Q\{Q_s,Q_t\} Q{Qs​,Qt​} Q s { e 1 , . . . , e m } Q_s\{e_1,...,e_m\} Qs​{e1​,...,em​}为问题实体集合 Q t { e 1 , . . . , e n } Q_t\{e_1,...,e_n\} Qt​{e1​,...,en​}为答案实体集合一个LLM f f f 和一个知识图谱 G G G, G G G包含三元组头实体关系尾实体表示为 ( h , r , t ) (ℎ,r,t) (h,r,t)目标是学习一个提示函数 f p r o m p t ( Q , G ) f_{prompt}(Q,G) fprompt​(Q,G)生成一个提示 x x x将 Q Q Q的上下文和 G G G中的事实知识结合起来使得LLM的预测能够输出 Q Q Q的正确答案。 3.KnowGPT Framework KnowGPT根据问题背景和答案选项从现实世界的知识图谱中检索出一个问题特定的子图。首先路径提取模块寻找最具信息量和简洁推理背景来适应上下文。然后优化提示转换模块考虑给定问题的知识和格式的最佳组合。 3.1 如何检索KG强化学习(Reinforcement Learning, RL) 利用奖励函数激励RL提取KG子图中有关问题中提到的源实中到潜在答案中的目标实体的路径 P { P 1 , . . . , P m } P\{P_1,...,P_m\} P{P1​,...,Pm​}。且 P i { ( e 1 , r 1 , t 1 ) , ( t 1 , r 2 , t 2 ) , . . . , ( t ∣ P i ∣ − 1 , r ∣ P i ∣ , t ∣ P i ∣ ) } P_i\{(e_1,r_1,t_1),(t_1,r_2,t_2),...,(t_{|P_i|-1},r_{|P_i|},t_{|P_i|})\} Pi​{(e1​,r1​,t1​),(t1​,r2​,t2​),...,(t∣Pi​∣−1​,r∣Pi​∣​,t∣Pi​∣​)}。RL使用策略梯度。其马尔可夫过程定义如下 状态 表示知识图谱中当前的位置表示从实体ℎ到t的空间变化。状态向量 s s s定义为 s t ( e t , e t a r g e t − e t ) s_t(e_t,e_target−e_t) st​(et​,et​arget−et​)。为了获得从背景知识图谱中提取的实体的初始节点嵌入将知识图谱中的三元组转换为句子并将其输入预训练语言模型中以获取节点嵌入。 动作 包含当前实体的所有邻近实体。通过采取行动模型将从当前实体移动到选择的邻近实体。 动作转移概率P 转移模型的形式为 P ( s ’ ∣ s , a ) 1 P(s’|s,a)1 P(s’∣s,a)1如果通过动作 a a a将 s s s到达 s ’ s’ s’否则 P ( s ’ ∣ s , a ) 0 P(s’|s,a)0 P(s’∣s,a)0。 奖励函数包括 提取路径的可达性、上下文相关性和简洁性。 路径的可达性 如果在K个行动内达到目标将获得奖励1。否则将获得奖励−1。 上下文相关性 路径与上下文越相关越应该被奖励 简洁性 基于黑盒LLMs对输入长度的限制和调用成本考虑引导的提示需在最短的路径长度内找到尽可能多有价值的信息。 最终奖励函数 3.2 如何利用检索到的KG Prompt Construction with Multi-armed Bandit MAB 多臂赌博机MAB有许多“臂”每次选择一个“臂”进行尝试都会得到一个结果或奖励。一方面希望“利用”那些之前表现良好的“臂”可以在短时间内获得最大的奖励。另一方面也想“探索”那些之前没有尝试过的“臂”可能发现更好的策略或选择从而在未来获得更大的奖励。 基于该原理提示构建就是要想办法选择最有前途的提示。多种方法组合有点类似集成学习但不一样 假设有几种路径提取策略 P 1 , . . . , P m P_1,...,P_m P1​,...,Pm​和几种候选提示格式 F 1 , . . . , F n F_1,...,F_n F1​,...,Fn​。每个路径提取策略 P i P_i Pi​是一种在给定问题环境下选择子图的方法每个提示模板 F j F_j Fj​代表一种将子图中的三元组转化为LLM预测的提示机制。 提示构建问题是要确定给定问题的最佳 P P P和 F F F的组合。本文将选择的整体过程定义为一个奖励最大化问题 m a x ∑ r P F max\sum{r_{PF}} max∑rPF​其计算如下 为了捕捉问题与不同知识和提示格式组合间的上下文感知相关性 文章使用期望函数 E ( ⋅ ) E(·) E(⋅)来确定多臂赌博机的选择机制。它能自适应地衡量不同问题对某个组合的潜在期望。 J J J表示最小二乘训练LOSS β ( i ) β^(i) β(i)通过最大置信上界(UCB)计算。通过最大化期望函数 E ( ⋅ ) E(·) E(⋅)LLM学会了平衡开发和探索以优先选择最有前途的提示来回答特定的问题背景。 4. Implementation 路径抽取策略两种 P R L P_{RL} PRL​基于强化学习的路径提取策略。 P s u b P_{sub} Psub​由于强化学习不够稳健引入 P s u b P_{sub} Psub​作为MAB选择的备选策略。这是一种启发式的子图提取策略在源实体和目标实体周围提取2跳子图。 Prompt三种: 三元组 F t F_t Ft​例如(Sergey_Brin, founder_of,Google)。 句子描述 F s F_s Fs​将知识转化为口语化句子。 图表描述 F g F_g Fg​将知识视为结构化图表来激活LLM。通过使用黑盒LLM预处理提取的知识突出中心实体生成描述。 MAB通过来自语言模型的反馈进行训练以优先选择在不同实际问题背景下最合适的两种提取方法和三种预定义提示格式的组合。 5. Experiments 5.1 实验设置 关注问题 RQ1: How does KnowGPT perform when compared with the state-of-the-art LLMs and KG_x0002_enhanced QA baselines? RQ2: Does the proposed MAB-based prompt construction strategy contribute to the performance? RQ3: Can KnowGPT solve complex reasoning tasks, and is KG helpful in this reasoning process? 数据集: 选用CommonsenseQA多项选择题问答数据集OpenBookQA多项选择题MedQA-USMLE医学多项选择题。 Base ChatGPT 5.2 对比实验 整体表现 与其他KGLMs方法对比 5.3 消融实验 5.4 case study-多提示融合的有效性 可参考https://mp.weixin.qq.com/s/k7tzvAXlCPQLHy1l8Wtx1Q
http://www.yingshimen.cn/news/47022/

相关文章:

  • 企业网站建设的具体需求网站搜索模块
  • 高唐企业建网站服务商做鞋原料网站
  • 黄岛外贸网站建设中国vpswindows野外农民工
  • 安全标准化建设网站wordpress 移动支付宝
  • 健康门户网站建设内容郑州电商网站开发
  • 哪个网站帮忙做户型方案巨量算数官方入口
  • html5国外酷炫网站济南百姓网免费发布信息网
  • 高端网站设计平台高端网站设计企业邢台做网站的公司有那个
  • 阳东城乡规划建设局网站个人网页设计作品简约
  • 工信部网站原来是做购物平台网站 民治
  • 公司网站哪个建的好wordpress .po文件
  • 淘宝网站怎么做特价两个人看的视频在线观看
  • 域名可以做网站名吗自己建设影视网站
  • 免费网站空间免费主机建设一个网站需要用到几个语言
  • 如何查看网站的空间关于建设网站的请示
  • 建站精灵网站模板王野虓
  • 柳江区城乡住房建设局网站做搜狗手机网站优化快
  • 大连做网站价格贵州省建设厅住房和城乡建设官网二建考试
  • 重庆seo网站推广工具做网站要坚持
  • 新沂市建设局网站wordpress rest api评论
  • 科技部网站公布首批创新型县(市)建设名单服务营销的概念
  • 网站建设推荐信息苏州网站建设logo
  • 网站设计师和网页设计师兰州app外包
  • 做网站广告软件四川seo推广公司
  • 登录河北建设厅网站进入不了察隅网站建设
  • 服装设计网站哪个好怎么做个网站
  • 江苏建设人才网官网乐清网站优化推广
  • 易经网站建设应用网站建设昆明包装设计
  • 高阳网站制作公司营销策划方案
  • 如何编辑企业网站石家庄logo标志设计