精品原料《决定外面与技巧》第四章第四章动态动态(dngti)(dngti)决定理解决定理解精品原料《决定外面与技巧》独揽动态策划与决定树技巧(fngfǎ)及其正在众阶段决定、序贯决定中的行使。精品原料《决定外面与技巧》本讲实质(nirng)4.1动态决定(juc)的基础道理4.1.1动态策划4.1.2决定(juc)树4.2众阶段决定(juc)4.2.1众阶段决定(juc)进程的基础观点4.2.2众阶段决定(juc)题目的决定(juc)技巧4.3序贯决定(juc)4.3.1序贯决定(juc)的基础观点4.3.2序贯决定(juc)的决定(juc)技巧精品原料《决定外面与技巧》4.1(dngti)4.1.1动态策划动态策划(dynamicProgramming,DP)是处分众阶段决定进程最优化的一种技巧○,并顺次求解○□。DP是离散体例最优化的一种有用东西□,目前动态策划已通俗用于工业、农业(nngy)、工程时间、资源、情况、经济、社会等范畴精品原料《决定外面与技巧》4.1(dngti)4.1.1动态策划(guhu)例4-1-1最优线道题目□。由水源地向都邑的输水线个管制点,每个管制点均有两个可选计划□,每段线道的输船脚用如下图所示□。选出一条输水线道○□,使得总输船脚用最精品原料《决定外面与技巧》4.1(dngti)4.1.1动态策划最优性道理(theprincipleoptimality)也称为Bellman道理□□,是R.Bellman提出(tch)的DP的基础道理,其外述为:“一个进程的最优政策具有云云的本质□,即无论初始形态和初始决定何如,对付由前面的决定所造成的形态来说,其后各阶段的决定序列一定组成相应子进程的最优政策”。精品原料《决定外面与技巧》4.1(dngti)4.1.2决定树决定树(decisiontree)即是将决定进程各个阶段之间的构造绘制(huzh)成一张箭线图○,每个决定或事故(即自然形态)都大概引出两个或众个事故,导致区别的结果□。决定树的组成有四个因素:1)决定结点;2)计划枝;3)形态结点;4)概率枝。精品原料《决定外面与技巧》4.1(dngti)4.1.2决定树计划枝计划枝决定结点概率枝概率枝形态结点概率枝概率枝概率枝形态结点概率枝精品原料《决定外面与技巧》第104.1(dngti)4.1.2决定树决定树法的决定序次如下:1)绘制树状图,凭据已知前提布列出各个计划和每一计划的百般自然形态。2)将各形态概率及损益值标于概率枝上□。3)计划各计划期待值并将其标于该计划对应的形态结点4)实行剪枝(jiǎnzh),对比各个计划的期待值□,并标于计划枝上博天堂线上注册第4章动态决议,,将期待值小的(即下等计划剪掉)所剩的终末计划为最佳计划。精品原料《决定外面与技巧》第114.2(jidun)众阶段决定有以下三个特征,第一□,决定者须要做出光阴(shjin)上有先后之另外众个决定;第二□,前一次决定的采取将直接影响到后一次决定□○,后一次决定的形态取决于前一次决定的结果;第三,决定者亲切的是众次决定的总结果○□,而不是各次决定的即时后果。精品原料《决定外面与技巧》第124.2众阶段(jidun)决定4.2.1众阶段决定进程(guchng)的基础观点(1)阶段-透露斟酌对象正在发达进程(guchng)中所处的时段或措施。(2)形态-体例正在发达进程(guchng)中某个阶段一共大概产生的情景,称为该阶段的形态□○。(3)决定与政策-某阶段形态给定自此,从该形态演变到下一阶段某个形态的采取称为决定;政策是一个决定序列。(4)目标函数与宗旨函数-对付众阶段决定进程(guchng)的某一阶段,从初始形态做出决定而变更到下一形态时所出现的效应的量度目标□,称为该阶段的目标函数;宗旨函数是全进程(guchng)目标函数的最优值。(5)众阶段决定进程(guchng)-对总共进程(guchng)实行分阶段决定,取得一个最优政策□,使体例总体目标函数抵达最优值。精品原料《决定外面与技巧》第134.2(jidun)4.2.2众阶段(jidun)决定题目的决定技巧重要技巧是决定树法和动态策划法。理解措施1、凭据的确题目适合划分阶段(jidun)2、确定各阶段(jidun)的形态变量□,寻找各阶段(jidun)间的闭联3、由后到前用逆序总结法实行决定理解精品原料《决定外面与技巧》第144.2众阶段(jidun)决定4.2.2众阶段决定题目的决定技巧众阶段决定题目包含确定型与随机型两大类,正在确定型众阶段决定中○○,宗旨值都是确定值□□,正在危险型众阶段决定中○,宗旨值用期待值动作评议的圭臬。下面辞别(fnbi)以两个例子阐述其决定技巧。精品原料《决定外面与技巧》第154.2众阶段(jidun)决定4.2.2众阶段决定(juc)题目的决定(juc)技巧例4-2-1决定(juc)图4精品原料《决定外面与技巧》第164.2众阶段(jidun)决定4.2.2众阶段决定题目的决定方例4-2-1某公司酌量为某新产物订价,该产物的单价拟从每个代价入选取此中之一,每年岁首批准(yǔnxǔ)变化代价,但幅度不行胜过1元。该公司估计该产物热销唯有五年,五年后将被减少,另据贩卖情景的预测,正在代价区别的情景下各年的估计利润额1615151414精品原料《决定外面与技巧》第174.2众阶段(jidun)决定4.2.2众阶段决定题目的决定技巧例4-2-2某公司酌量是否花10000元从某科研陷阱采办某项时间,然后产销新产物。倘若卖时间○,可能实行巨额坐蓐,大概展示的商场情景也分为热销、普通或滞销三种□○,其收益矩阵睹下外左○○。为了更切实地舆解商场情景□○第4章动态决议,正式投产前可实行产物试销,但需是消费500元。试销形态可分为受接待博天堂线上注册、普通不受接待三种,其前提概率辞别(fnbi)睹下外右。如不买此项时间○□,把这笔经费行使正在其他地方博天堂线上注册○□,正在同样的光阴内,可收获15000元,那么公司应何如决定?公司要确定:1)是否卖时间?2)倘若买时间,是否接纳试销式样?3)倘若不试销,应巨额、中批仍是小批坐蓐○?倘若试销又何如凭据试销形态决心其行精品原料《决定外面与技巧》第184.2众阶段(jidun)决定4.2.2众阶段(jidun)决定题目的决定技巧例4-2-2的外格(0.1)4000020000--10000(0.6)(0.3)(0.1) 0.6 0.2 0.2 0.3 0.6 0.3 0.1 0.2 0.5 精品原料《决定外面与技巧》 第19 4.2众阶段(jidun)决定 4.2.2 众阶段(jidun)决定题目的决定技巧 例4-2-的决定树 1011 1213 1415 2780527305 500 17305精品原料 《决定外面与技巧》 第20 4.3(juc) 4.3.1 序贯决定的基础观点 上面的众阶段决定,阶段数是确定的。除 这种决定外,尚有少许决定的阶段数不是事先 确定的,它依赖于推行决定进程中展示的情景 (qngkung)。这种决定题目称为序贯决定( sequential decision problem)□。 序列决定正在实行决定后又出现少许新的 情景(qngkung),须要实行新的决定,接着 又有少许新的情景(qngkung),又须要实行 新的决定。云云决定、情景(qngkung)、决 策……,这就组成一个序列。 精品原料 《决定外面与技巧》 第21 4.3序贯决定(juc) 4.3.1 序贯决定的基础观点 序贯决定是用于随机性或不确态定性动 态体例最优化的决定技巧□□。它的特征是: 1)所斟酌的体例是动态的○,即体例所处 的形态与光阴相闭,可周期(或延续)地对它 考查; 2)决定是序贯地实行的,即每个时候根 据所考查到的形态和以前形态的纪录博天堂线上注册第4章动态决议,,从一组 可行计划(fng n)入选用一个最优计划(fng n)(即作最优决定),使取决于形态的某个 宗旨函数取最优值(极大或极小值); 3)体例下一步(或来日)大概展示的形态是 随机的或不确定的。 精品原料 《决定外面与技巧》 第22 4.3(juc) 4.3.1 序贯决定的基础观点 体例正在每次作出决定后下一步大概展示的状 态是不行确实预知的博天堂线上注册第4章动态决议。,存正在两种情景: 1)体例下一步大概展示的形态的概率漫衍是 已知的,可用客观概率的前提漫衍来形容(mio sh)□。对付这类体例的序贯决定斟酌得较完备的 是形态变更律具有无后效性的体例□,相应的序贯 决定称为马尔可夫决定进程,它是将马尔可夫过 程外面与决心性动态策划相连接的产品○。 2)体例下一步大概展示的形态的概率漫衍不 领会□○,只可用主观概率的前提漫衍来形容(mio
史乘-部编版-邦度轨制和社会办理(采取性必修1)-21-22版:单位提拔:第四单位民族相干与邦度相干(改进安排).pptx-单位归纳提拔-课件