摘要

抽象层次上FO-POMDP的引入,使得人们可简洁地、陈述地表达复杂的POMDP,解决常规POMDP在实际中所无法解决的大规模决策问题。介绍了FO-POMDP的基础,包括状况表达式、行动、观察值和观察函数。提出了一阶信念状态的概念,并分别针对随机转移行动和随机观察行动给出一阶信念状态的更新方法。最后用FO-Tiger-Grid模型对一阶信念状态的概念和更新方法进行了实例分析验证。

全文