登录注册写文章

论文<Learning action models from plan examples using weighted MAX-SAT>笔记

论文<Learning action models from plan examples using weighted MAX-SAT>笔记

背景

智能规划求解器需要有动作模型和PDDL作为输入，然而从头构建动作模型是十分困难的，于是提出ARMS算法可以从正确的规划中直接学习动作模型。值得注意的是，ARMS算法的输入不要求观测到的规划必须包含中间的状态信息。

Introduction

创新点

以前的方法学习动作模型都需要规划的状态信息和动作序列
ARMS学习动作模型不需要规划解的状态信息

基本概念

action signature
动作名和动作参数列表构成的字符串。

目标

学习动作模型，具体来说:

学出每个action signature的前置条件
学出每个action signature的后置条件

ARMS算法

ARMS算法有2大阶段

Phase one
从所有规划中挖掘动作集合
Phase Two
从动作集合以及最初的relation-action pairs确定一些Constraints，然后将Constraints转化为weighted MAX-SAT问题并求解。

Related Work

Learning from state images
Inductive logic programming
Knowledge acquisition in planing
Satisfiability problems
Markov logic networks
Relation to SLAF algorithms
PDDL background

Problem statement

ARMS算法的输入:

初始状态
目标状态
动作序列

ARMS算法详情

模型空间很大，如何寻找较优模型?
答:利用Constraints对模型空间进行限制。

最后编辑于：2017.12.06 04:32:56

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

存在的维度（2）—“我”的结构
我们已经发现，以往的许多哲学家在探讨存在问题时，不自觉的设定了多个不同的自明性的前提，同时又没有去说明这些前提的自...
博鸿阅读 792评论 4赞 6
智慧树
我随手扔掉的苹果核长出了一棵小小的苹果树。我有智慧， ...
姜一帆ff阅读 1,818评论 0赞 3
大数据工程师(升级版) - 网易云课堂百度云网盘分享下载
Q: 这门课程详情介绍 A: 课程专注大数据必备技能和核心技术，包括工具选择，存储、编程、处理和管理数据架构等。项...
丽影学院阅读 2,007评论 0赞 0

赞1赞

赞赏

手机看全文