摘要

基于对零售商回收废品的奖惩,提出完全理性下博弈主体的最优策略;探究有限理性下博弈主体达到最优策略所经历的策略调整轨迹,对比分析稳定系统中两种策略的关系。结果表明:调整奖惩标准仅影响零售商利润;提升奖惩力度能够提高废品回收率,对制造商、零售商和消费者都有利;处于稳定状态的系统,博弈主体从不同的初始状态出发经过长期反复的策略调整能够收敛于最优策略。