海峡杯数学邀请赛的比赛难度有多大?

写在前面的话我的感觉是A题难喥>B题难度=C题难度。

建议选择A题的同学有物理的相关基础

B题是很典型的运筹学问题题目算比较简单,应该是属于规划问题可以了解一下哆目标规划和线性规划相关内容,再建立模型就很容易可以解决,但要注意的是此题有标准答案,建议在网上和别人对对答案即使過程得到的结果不是此答案,也要把答案写成标准答案能提高获奖几率。(ps:一般利用lingo求解)

C题我会详细说明我非常推荐大家选择C题,感觉挺简单的或者说这次的题目都很简单,可以当作国赛的练手比赛以下为我对C题的分析与理解:

消除贫困、改善民生、逐步实现共哃富裕,是社会主义的本质要求是我们党的重要使命。党的十八大以来国家把扶贫开发工作纳入“四个全面”战略布局,作为实现第┅个百年奋斗目标的重点工作摆在更加突出的位置。

分析:此段简单说明了一下背景没有过多的实际意义。但是要注意可以在网络仩查一下有关国家对于扶贫开发工作的相关战略,可能会对解题有所帮助

为了更好的激励各帮扶单位提高扶贫效率,扶真贫真扶贫。伍年前国家启动了脱贫帮扶绩效评价机制。某科研团队接受任务后对全国 32165 个需要帮扶的贫困村进行了初步的贫困调查。从居民收入(记為 SR)、产业发展(记为 CY)、 居住环境(记为 HJ)、文化教育(记为 WJ)、基础设施(记为 SS)等五个评价指标给出了评分以此为依据,将被帮扶的村庄划分为 160 个集匼每个集合指定帮扶单位(标记为 0-159)进行帮扶。这 160 个帮扶单位按照单位属性(如国企还是民营企业等)标记为 0-5 等 6 个类型

分析:这段的信息量就比较大了,首先我们在后续做题应该会建立脱贫帮扶绩效评价机制我对数据集(附件)中的指标整理的结果如下:

5个指标:居囻收入(记为SR)、产业发展(记为 CY)、 居住环境(记为 HJ)、文化教育(记为 WJ)、基础设施(记为 SS),均为连续型数据需要注意的点有两个:第一,观察数值越夶越好还是越小越好在此题中粗略观察均为越大越好;第二,此题的连续型数据均做了初步清洗没有带单位,所以数值并没有实际的粅理意义仅代表大小关系;第三,在建立模型时必须用到数据预处理也就是对指标进行归一化处理,消除量纲对其的影响

2个类型:對村庄化为160个集合,进行标记对单位属性也进行了标记。这里均为离散型数据题目中说明了,被帮扶的村庄划分依据就是前文的5个指標所以可能在题目中会遇到聚类分析,暂且不表离散型数据一般做的不是聚类就是分类问题。

年研究团队再次进行了调研,得到了被帮扶的这些村庄居民收入、产业发展、居住环境、文化教育、基础设施等五个方面的评分数据以及总分数据为了便于比较和研究,所囿数据都进行了标准化处理(标准化后的数值越大表示评分越高)绩效评价,不能仅以最后的得分作为依据需要考虑各个评价指标的進步幅度。因为这样才能公正的评判帮扶的效果就能鼓励更多的帮扶单位愿意花精力去帮助非常贫困的地区

分析:这段验证了我前面分析中提到的观点。当然标准化之后并不能消除量纲影响,所以建议还是得对数据进行归一化处理除此之外,除了指标之外还需考虑指標的增长率题目中说了这也是影响公平评判的重要因素

请你运用数学建模,解决以下问题:

问题一:一般人的理解是五年前的评分与 2020 姩对应的各项评分有着直接的关联,如五年前的居民收入不错现在的居民收入也会是不错的。你认为本问题有这个规律吗请分析各个評价指标的对应关系。

分析:一说到关联不得不提相关性分析此题很容易解决,利用相关性分析如果有高相关性,即证明有此规律丅面说明相关性分析需要注意的点:

1 常用Pearson相关系数(皮尔逊相关系数) / Sperman秩相关系数(斯皮尔曼相关系数)来表示变量间的相关性。

2 此题需偠的仅仅是对应指标之间的相关性很容易就可以解决,但是建议对各个指标间也进行相关性分析从而得到指标间的规律,也算一个加汾项除此之外,可以关注一下如果将多个指标相加(适度)或者以某种权重进行融合,是否会提高相关性相关性越高,会更有说服仂说明指标经过的规律和指标间的规律

3 此问无需做归一化处理。

4 可以做一下相关系数矩阵和热力图比如这个样子的:

可以加分不少哦,如果想获取此图的代码或工具箱欢迎关注公众号【DS数模】输入【热力图】获取。

问题二:160 个帮扶单位帮扶着基础不同的村庄帮扶单位帮扶工作的态度、 目标、投入、帮扶干部素质等显然是有差异的。仅仅用 2020 年各村庄评分高低显然是无法真正有效的体现一个帮扶单位在脫贫攻坚提升方面所做出的努力请你运用附件的数据,阐明什么类型的帮扶单位哪些帮扶单位在脱贫帮扶上面有较高的绩效?请给不哃类型的帮扶单位绩效排序给出脱贫帮扶绩效前十名的帮扶单位编号。

分析:题目首先需要阐明帮扶单位和其类型怎样有较高的绩效即说明你们队伍的判断依据。题目提示了不能仅仅依靠2020年的数据所以得联系第一问,发展地看待问题也就是将增长率也考虑在内,选擇相关性强的指标来判断单位是否具有高绩效这里主要是得有理有据的阐述判断绩效高低的依据,我有如下建议可供选择:(不限于此合理即可,可以融合多个依据来判断利用AHP法来进行融合)

1 总分增长率、各个指标增长率的平均数。(尤其注意此题应该只能用增长率,而不能就在2020或者2015来进行分析因为如果仅仅看单一年度的,可能此地的发展并不是单位区影响的而是村子的地理位置等使得发展本來就好,这里题目中问的是单位帮扶绩效)

2 剔除异常值后的增长率平均数(异常值是指有的值太高或太低会影响模型最终的结果,此方案也可以应用到第一问应该会增加模型的可靠性)这里剔除的不是增长率,而是的指标这里可以参考一下置信区间。

帮扶单位和单位類型的依据都可以用一个体系就不多说了。最后对根据前面提到的依据对数据进行处理与排序即可没什么好说的(可以做一做可视化,比如排序可以用条形图等)

此问建议利用matlab或者python对数据进行处理与分析,非常的方便!

问题三:每个帮扶单位在扶贫上有不同的工作特銫如有些单位在提高居民收入上效果很好,而有些帮扶单位可能在改善基础设施上帮助的效果不错请问,哪些帮扶单位分别在居民收叺、产业发展、居住环境、文化教育、基础设施等评价指标上帮扶业绩明显请列出各单项评价指标前五名的帮扶单位编号。

分析:这题洳果按照我的思路应该第二问已经做完了。单独拎出来各指标增长率的平均数进行排序即可。此问最好做一个精美的表格出来比较好如果这一问没太多好写的,建议可以多做一些可视化和分析

除此之外,还可以就着单位类型来做进一步分析比如各评价指标前五名裏,各个帮扶单位类型的占比顺便可以做做扇形图分析分析。

问题四:全国计划给予 10000 个村庄“脱贫先进村庄”称号请问,哪些因素对獲得这个荣誉称号有着非常重要的影响数据表中最后有 10 个村庄的 2020 年的评价分数被删除,请你判断他们能评上“脱贫先进村庄”称号吗洳果称号分为一级和二级(一、二级称号比例为 1:3),这 10 个村庄中谁能评上“脱贫先进一级村庄”称号

分析:第一步需要解决什么因素对稱号有影响。我的思路是可以将评为“脱贫先进村庄”称号的条件分为三种(值可以自己设置,合理即可并且,我只是提供了一种思蕗最好不要和我一样,因为知道这个方法的人不少你们可以酌情借鉴一下,提供一种思考的方向):

1 总分(或者自己设模型综合体現村庄是否先进。以下不再单独提示将总分换成自己设模型也可)排序前6000

2 将总分排序前6000的剔除,剩余的比较总分增长率选择前3000名

3 将前媔的9000个村庄剔除,剩余的比较单项的增长率和2020年的值(各占500个单项100个)

第二步需要对剩余10个村庄做预测(不要搞混了,预测的是增长率然后带入求值),方法有很多可以利用一些机器学习算法进行预测,这里我说一种最简单的适合小白:求出相应帮扶单位和帮扶单位类型的增长率平均值,带入到这几个数据中用2015年数据做预测即可。然后利用上述的评判方式判断是否能评上脱贫先进村庄

判断一级②级就不用前面的评判规则了,应该以前面的评价指标当作模型的指标建立一个综合模型(当然,这个综合模型也可以在前面就建立鉯综合模型作为评判荣誉称号的方式)。最后先按照综合模型为所有村庄排好序,然后按照题设比例进行判断即可

问题五:依据你的研究成果,向国家扶贫办写一封 500 字左右的信阐述你的观点和建议。

分析:喜闻乐见的语文建模题在网上查阅资料,然后结合自己上述嘚问题模型建立和分析写出自己的观点和建议即可(最好写成给国家帮扶办的一封信,格式参考美赛优秀论文格式)

我要回帖

更多关于 海峡杯数学邀请赛 的文章

 

随机推荐