欢迎光临
我们一直在努力

北京大学取得分布式多智能体合作方法专利通过强化学习进行训练

  金融界2025年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2025年5月

  金融界2025年12月18日消息,据国家知识产权局公告,北京大学取得一项名为“一种分布式多智能体合作方法、系统、介质及设备“,授权公告号CN116578636B,申请日期为2025年5月。

  专利摘要显示,本公开涉及一种分布式多智能体合作方法、系统、介质及设备。该方法包括:对将过去对局历史中特定步骤数量的观测状态进行存储以构造观测历史寄存器;所述历史寄存器随着智能体与环境交互的进行,所述历史寄存器持续接受新的历史状态,并将超过容量限制的早期的历史状态丢弃;构造历史背景网络,其中,所述历史背景网络的输入为当前观测状态,与历史寄存器中的历史状态,通过数据挖掘与融合,所述历史背景网络的输出历史背景嵌入状态;构造隐式变分推理网络,构造策略网络和状态价值网络并通过强化学习进行训练,其中,所述策略网络和所述状态价值网络的输入为信念嵌入和当前观测状态,所述策略网络和所述状态价值网络的输出为策略分布和状态价值。

赞(0)
免责声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至qingfengxiake@qq.com举报,一经查实,本站将立刻删除。
文章名称:《北京大学取得分布式多智能体合作方法专利通过强化学习进行训练》
文章链接:https://www.1126888.com/a/07593825.html