游戏者开始是$1的奖金,要求回答n个问题。对每个问题,他可以: • 退出并保有奖金 • 回答问题。如果错误,就退出并什么都得不到。如果正确,那么奖金翻倍,并可继续回答下一个问题。 在回答最后一个问题后,他获得奖金并退出。游戏者想要最大化他期望获得的奖金。 一旦提出了一个问题,游戏者就能以概率p正确回答。对每个问题,我们假设p是一个随机变量,分布的范围是t..1。 输入行数,每一行有两个数字:整数n和实数t, 1 ≤ n ≤ 30, 0 ≤ t ≤ 1.n表示要回答的问题的个数,t表示游戏者能正确回答问题的概率的下限。以两个0表示输入结束。 对每个输入n,t,输出游戏者采用最佳策略时所期望获得的奖金,保留三位小数。 Sample input 1 0.5 1 0.3 2 0.6 24 0.25 0 0 Output for sample input 1.500 1.357 2.560 230.138 |
看了答案都是从后往前推的,请问为什么?