您现在的位置是:首页 >  云笔记 >  专业学习 >  文章详情

什么是最优停止理论OST?

豆豆   2023-12-12 19:38:59   1781人已围观

最优停止理论(Optimal Stopping Theory)是一种数学决策模型,它主要用来解决“何时停止寻找并做出决定”的问题。这个理论通常用于描述在有限的选项中进行选择的情况,比如求职、购房、选择伴侣等。


举个例子:

让我们通过一个关于寻找理想伴侣的小故事来解释最优停止理论。假设在一个王国里,国王有37个女儿,每个公主都是独一无二的。邻国的王子想娶其中的一位公主为妻,但他只有一次机会去见她们,并且他不能回头再看已经见过的公主。如果他在见到某个公主后决定不再继续寻找,那么他就必须娶那个公主。

王子面临的问题是如何制定策略,以便找到他认为最理想的公主。他不能花太长时间去看所有的公主,因为这样会失去最佳人选;也不能太快做出决定,因为可能会错过更好的选择。根据最优停止理论,王子应该采用如下的策略:

1、在前37%的时间里(即看到第12位公主之前),他应该观察并了解各个公主的特点建立自己的参照决策依据,但不与任何一位公主结婚。

2、一旦到了第12位公主,他将从那一刻开始评估每位新遇到的公主,并选择第一个遇到的比前面所有公主都要好一些的人作为他的新娘,立即停止不再继续往下寻找。

这样的策略使得王子有最高的概率(约为37%)找到他认为最好的公主。

哪为什么是37%呢?这是基于数学计算和模拟的结果,接下来我会用数学原理告诉您37%是如何计算出来的。


数学原理

最优停止理论实际是基于概率和期望值的计算。在上面这个例子中,我们可以将每个公主看作是一个随机变量,它们代表了对各个公主的喜爱程度(或质量)。我们的目标是在有限的样本空间里找到具有最大期望值的选项。

(1)、为了计算出最佳的停止时间,我们需要考虑两个因素:

1、继续寻找的可能性:如果我们还没有遇到最好的公主,那么继续寻找可能会有更高的回报。

2、错过最佳选项的风险:如果我们已经错过了最好的公主,那么继续寻找只会浪费机会,不会得到更好的结果。

最优停止理论的核心在于找到一个平衡点,使得这两个因素达到最优状态。


(2)、哪为什么是37%?

还是具体到上面的故事,假设共有N个公主(在这个例子中,N=37),我们要找到一个最小的整数K,满足以下条件:

如果最好的公主出现在前k位,则我们肯定会在前k位就看见了她。

如果最好的公主出现在后N-k位,那么我们有最高的概率在看到她时就停下来。

为了解决这个问题,我们可以利用贝叶斯定理和期望值的计算方法。经过数学推导,我们发现当k约等于N/e时(其中e是自然对数的底数,约为2.718),上述两个条件可以同时得到满足。对于N=37的情况,k≈37/2.718≈13.5,所以我们可以取k=13或14,实际上,取k=13会更接近于最优解。


应用场景

最优停止理论广泛应用于各种领域,包括但不限于:

招聘:公司面试候选人时,如何确定什么时候停止面试,接受当前的最佳人选。

房地产购买:购房者在看房过程中,如何判断何时停止继续看房,下定决心购买某套房子。

科研实验:研究人员在进行实验时,如何确定何时停止实验,认为结果已经足够显著。

网络约会:用户在浏览潜在匹配对象时,如何判断何时停止浏览,向某个人发送消息。

虽然最优停止理论提供了一个有效的框架来指导决策,但在实际应用中还需要考虑到具体的环境因素和个人偏好。





分享到:

编辑发布时间:2023-12-12 19:38:59