导读: 我于2019年第一次参加美赛,最后获得 Meritorious Winner 。结合赛前学长的分享与告诫,自己总结了些“套路”和“经验”,在这里以自己的B题为例,把“干货”分享给同学们。近年来美赛名声越来越差,文末我想简单讨论下参赛的意义。
目录:
- 1 建模思路与写作技巧
- 1.1 把模糊的题目梳理清楚
- 1.2 模型要简洁,让人容易“看得懂”
- 1.3 灵敏度分析:提取模型的意义
- 1.4 快速抽象、学习,而非套用“百宝箱”
- 1.5 使用 LaTeX 与 mcmthesis 包排版
- 2 美赛值得参加吗
- 2.1 我们队伍的人员配置与参赛过程
- 2.2 画画都能得O奖,美赛还有公信力吗(美赛的评奖机制)
- 2.3 美赛国赛如一场小型科研,但科研本不该如此
1 建模思路与写作技巧
奖项 | 2017年获奖比例 | 2019年获奖比例 |
---|---|---|
Outstanding Winner | 0.16% | 0.14% |
Finalist | 0.27% | 0.17% |
Meritorious Winer | 8.88% | 7.09% |
Honorable Mention | 37.97% | 15.35% |
Successful Participant | 51.55% | 67.50% |
如上,对于 H 奖来说,2019年美赛获奖比例有明显降低。那么 H 奖和 M 奖的作品有什么差别呢?如何脱颖而出,成为前 7% 呢?我大概总结了以下五条:
- 问题可能很模糊,但思路一定要明确
- 模型要简洁、清晰
- 别忘了建模的目的——灵敏度分析很重要
- 请抛弃各公众号“百宝箱”,美赛国赛比拼的是快速学习的能力
- 务必抛弃 word 排版,使用 LaTeX
1.1 把模糊的题目梳理清楚
近年来美赛的题目越来越怪(用队友的话讲,不怎么好好出题了),很多很必要的、模型中很关键的条件都没有给出,这很令人奇怪。但为了拿下比赛,我们一定要快速做出假设,摒弃那些不重要和不明确的因素,把问题抽象为一个容易让评委理解的经典问题。 我以我2019年美赛和我们选择的B题为例。
2019年的题目是这样的:
- A:《权利的游戏》中,如何养龙?提提建议呗。
- B:波多黎各飓风后,无人机的侦查和物资运输方案?
- C:某药品成瘾与人口数据的关系?
- D:卢浮宫发生恐怖袭击,咋疏导?
- E:如何帮助企业意识到,破坏环境是有成本的?
- F:数字货币在金融体系中的可行性?
经过一天的纠结,我们队伍最终决定选择B题。原因有:
- 没看过《权游》、找不到卢浮宫的平面图(不会CAD)、不懂数字货币,抛弃A、D、F;
- C题尝试过,但当时我们还没有数据处理的经验,实在毫无头绪;
- E要建一个评价模型,对于我们学经管的还是挺熟悉的,但是评价模型都比较玄学,难以评定模型建得好坏,并且需要读大量英文文献,工作量大;
- B虽然题目较长,但比较好抽象成经典的规划问题、属于传统数学建模。
既然已经选择了B题,那就没有退路了。可是开始着手建模的我们傻了:这B题题目虽然长,但是众多条件怎么含含糊糊的?很多都要我们自己猜测检索吗?
对,就是要自己猜测。——这其实是近年来美赛比较奇怪的地方。
比如,题目中给了如上这个地图,其中的信息实际上是很难提取的:
- 地图上有很多符号、数字,但却没有一个图例,你甚至不知道这些信息代表着什么;
- 更重要地是,你不知道哪些信息对这道题有用;
- 图中的数字难道是海报高度吗?那就是说建模时要建立三维坐标系的路径规划?对于一个四天时间的比赛来说,简直有点扯。
诸如此类的“题目信息不明确”还有很多: 比如给了飞机的数据(甚至包括电池指标),但是没有给一个转换公式,看来这些指标的转换可以“随意发挥”了;比如集装箱是投放到灾区的,还是事先在灾区储备好(以防万一)的都没有说明;比如飞机与药品的装箱形式要靠想象等等。
在比赛中我们经历了很多纠结,我们甚至把题目中给的图片的出处找到了,但是并没有什么帮助。现在回过头看来,我们做的最有效的事,是把题目中要解决的问题很清晰地划分成了四个子问题:
- I 飞机评价模型:我们给飞机分工,建立指标评价,发现有些适合携带摄像机侦查、有些适合运送物资,最后选择合适的“飞机套餐”;
- II 装箱模型:三维装箱问题其实是世界级的 NP-hard 问题,这个应该是学界公认的,这里 我们注意到了美赛建模是为了解决实际问题,因此没有使用那些纯数学方法 (没有只为了得到数学上的最优解),而是 提供了一种工人可以操作的、评委容易看得懂的、直观上给人没有多少空间浪费的方法 (将药品组合打包成长宽高比近似于集装箱的立方体);
- III 选址模型:我们假设灾难发生后,只能投递两个集装箱,便做了一个传统的选址模型(投在哪里合适?这其中考虑了侦查成本、药品运输兼顾性);
- IV 路径规划模型:一共两个路径规划模型,分别是物资运输模型与摄像侦查路径规划。这是一个比较经典的 VRP 问题,我最喜欢的部分。为了解决这类问题,列出一个大大目标函数,然后下面是你头脑风暴得出各种约束条件,每个约束条件要有可解释性,很有趣,这种模型建出来后,合理性也极高。
值得注意的是,别看我上面复盘得热火朝天的,但是我们建模过程中是“举步维艰”的:因为我们要一边建模、一边出题。 就是这么夸张,如何运用题目中所给数据,如何假设救援的过程(我们至今也没有搞清楚无人机实际上是怎么到达据点的,因为题目根本没讲),这其中可以供参赛者“自由发挥”的地方实在太多了。以后美赛可能还会延续这种趋势,因此,同学们可以在参赛中注意:
- 选题后,果断对不明确条件大胆假设;
- 把问题抽象为自己擅长的问题,比如我擅长线性规划解决路径问题,我就很果断地说,无人机规划可以理解为一种 VRP 变形问题,然后顺着这个思路进行下去。
1.2 模型要简洁,让人容易“看得懂”
我学长,建模能力很强(深圳杯冠军+数竞等等成就),现在在清华读研,竟然在美赛折戟了。不忿之余,他总结了他经验,于我很受用:美赛的模型无需多严谨、模型不是考虑得越多越好,而是越清晰越好。
他举了一个例子,他那年我们学校有几个 F 奖的,结果一问,其中有一组大二的,与学长做的同一道题目。他们只是抓住了一个小角度,忽略了很多条件,建了个“线性规划”模型而已。他们的成功之处在于,把每条公式的出现原因、想表达什么都讲的很明白。
你问我什么是线性规划的话,我下面这个例子解释一下。
这就是一个线性规划的节选,还有其他几条约束式,我没有截图出来。线性规划的好处在于:很讲理,即你的目标很明确(最小化成本或者最大化效益等),条件也很明确。并且,如果线性规划可解,求出的一定是最优解。就算规模很大,你依旧可以求出近似最优解。
比如对于上面这个截图(选自一个车辆路径规划的论文),如果我列出了这些式子,紧接着,我可以在文章里解释说:
约束(2)表示每个客户只能分配一个集散地;约束(3)表示j点启用,才允许其为客户提供服务;约束(4)表示某集散地点若启用,一定要至少覆盖一个客户。约束(5)到(8)用于描述TSP基础模型,分别表示:货车只在被启用的集散地间通行;货车不可以走一个集散地两次(不可迂回);对于一个集散地,能且必须被进入一次,并走出一次;对于depot,也是只能进入/走出一次。
如果你用了一个特别新颖的方法,没人敢保证评委见过,评委有大概率不认可你个方法。更有可能的情况是,美赛题目这么灵活,大家解决的问题都是不同的,评委甚至看不懂你说什么(每天看几百篇论文,谁能不厌倦呢)。
说白了,美赛不是炫技地方,还是深入浅出、直白明了好一些。
还有一点,英语句子别太长太复杂。
1.3 灵敏度分析:提取模型的意义
建模是为了干什么呢?是为了解决问题。
我们不能奢求模型能够准确描绘这个问题,美赛也没要求参赛者能够在四天时间里建一个科学性十足的模型。大部分情况下,建模的意义不体现在拟合上,而体现在趋势的反馈上,即灵敏度分析。
这句话什么意思呢?我还拿上面的论文为例。
说白了,就是调整一个给定的参数,比如容纳能力:把容纳能力5、10、15、20、25的情况下得到的最优值及其他指标算一下,列个图表出来,然后告诉决策者,容纳能力越大越好。这其中,如果能得到反直觉的结论,比如“并非容纳能力越大越好,容纳能力大到一定程度,不如把这些投资投给别的方面受益大”,效果更好。
我们建的模型,可能很难为问题提供具体方案,因为做了太多的假设与简化;但是,可以通过灵敏度分析来判断发展趋势,这也是为什么美赛大多要求我们给政府/企业/养龙人写一份信。信中往往体现这个研究的结果:“在蛋白质和维生素中,您还是多味您的龙一点维生素吧,这样更好。”而不是:“对于1000公斤的龙,宁每吨喂50公斤猪肉、25公斤白菜就好。”
1.4 快速抽象、学习,而非套用“百宝箱”
实际上,美赛类似一场小型科研:题目来了,先将问题提取出来,再检索解决过类似问题的方法,套用、改进,最后得出结论。
很多公众号、知乎答主都介绍一大长篇“经验”,然后文末“很有良心地”给一个大大的压缩包,说这里有各种问题的代码(有些压缩包还加密了,需要付费破解)。我的看法是,没有用。不懂问题算法的人,把问题抽象为一个经典问题、套用代码(没有一对一量身打造的代码,就算一个动态规划,也有很多很多变形);懂问题的人,不需要现成的代码,知道要解决什么问题后,能利用网络找到自己所需的资源。
实打实提升算法能力、科研能力,知道建模是怎么一回事,比给营销号交智商税有用多了。
1.5 使用 LaTeX 与 mcmthesis 包排版
请使用 LaTeX 排版。
有了 mcmthesis 包的 LaTeX 就好像一个填空题:你只要按照他给的例子,把摘要、关键字、正文的文本填在相应位置就好。
推荐一个网站:Create LaTeX tables online: http://www.tablesgenerator.com/
如果你觉得用代码写表格有点费力的话,你可以在这个网站上制作表格,然后生成代码,再把代码复制到自己的文章中就好。
LaTeX 怎么学呢?资源在哪里呢?我想说,资源太多了。如何安装、如何使用的教程也太多了。都是免费的。检索时,注意筛选好的、精简的教程与资源。 如果你们队伍连入门 LaTeX 这个问题都无法在5个小时内解决,不好意思,我觉得你们美赛得奖的希望也不大。
2 美赛值得参加吗
2.1 我们队伍的人员配置与参赛过程
我们的队伍是两男一女,四天下来很累但是很开心。当时是期末考试过后没几天就进行美赛了,学校里的同学都回家了,我们就霸占一个教室,每天早上七点在食堂集合,晚上十一点左右大家一起走回宿舍,聊聊天。具体的时间安排为:
日期 | 上午 | 下午 | 晚上 |
---|---|---|---|
1.25 | 选题 | 尝试C题 | 放弃C题,决定选择E题 |
1.26 | 早饭时决定选择B题 | 开始认真读B题,发现什么玩意??? | 各种查资料、学模型 |
1.27 | 不能再犹豫了,咱们得开始了 | 问题框架大概想好了,模型有了 | 真的得开始了 |
1.28 | 四个模型大概都成了,吧 | 别忘了边建模边写作 | MEMO/摘要等,通宵自习室订座位 |
1.29 | 排版、捉虫,熬了个通宵 | 洗澡睡觉收拾行李 | 各回各家 |
比赛中会出现争论,但大家心是齐的。我们还有一个优势,就是分工特别明确:有人数理知识扎实、比赛经验丰富;有人编程、算法、绘图能力好;有人英语、写作、表达能力强。
不得不承认美赛注重排版与美观。最后的排版我们三个人都检查了好多遍,“捉虫”即找错别字、空格的缺失等等。
提交作品时,我们惊叹于:四天时间,我们是怎么做出这丰满的21页的?最后M奖,大家都很欣慰。这次美赛有很多大佬竟然得了DW,被判为无效,因此我们应该属于运气与实力都具备了。
2.2 画画都能得O奖,美赛还有公信力吗(美赛的评奖机制)
近年来,美赛因为其政治上的不严谨性,以及越来越扯的题目,备受批评。每个队伍都需要交 100 美元报名费与较高的 S 奖得奖率,尤其是美国本土队伍的参与积极性(2019年中国队伍:24904,美国队伍:371)很难不让人质疑:这不就是骗中国人钱吗?
对于这个问题,我不做否定回答。
但是——没有但是。
我身边有很多高手,建模能力、科研能力我是大写的服,但美赛却颗粒无收。我不相信他们在美赛都“碰巧”发挥失误了。
2019年开奖后,有人在知乎上晒出自己的得奖心得:我们画了很漂亮的龙素描!得了O奖,很开心!
我没有读到他们的论文,不能否认其文章中的模型。但是,评价模型本就难以分出好坏,美赛只有四天时间,一个队伍把大量时间花费在素描上,难道值得鼓励吗?我没有看到评审方的严谨性。
美赛得奖的队伍,一定有过人之处;但没得奖的队伍,真的有可能只是运气不好而已。以我自己为例,参加这个比赛,还是比较值得的:四天时间,大家齐心协力、共同咬牙奋斗,最后收获了友情与成绩,怎么说都是一段快乐的回忆。
目前国内大部分高校的官方都还是认可美赛的,但实际上,美赛的威信正在减弱(自己作的)。我们队伍中的三个人都保研成功,现在回头看来,真正能帮得上保研的,只有很高的专业排名与科研项目(维持很久的项目后者一篇论文)。
2.3 美赛国赛如一场小型科研,但科研本不该如此
最后我还是想吐槽一下这种短期建模比赛,因为我越来越不明白这是要比什么。
明明是一个科研问题,却非要把时间掐得只有三、四天。人家 ACM 等等算法大赛,比的是基础技能和智商,最后谁程序写得好谁牛逼,是实打实的硬核比赛,但这种“速成建模比赛”呢?比的是,谁“检索+建模+写作+排版”科研一条龙的业务能力强?这是在倡导一种浮躁的论文写作风气吗?
我的阅历其实也不是很广,况且现在是深夜,不适合太多吐槽。美赛国赛存在的意义一定是有的。
我希望我的文章能真真正正帮助到各位参赛者(哪怕让你在比赛中少一点点犹豫),也欢迎各位给我点赞、转发。
祝各位比赛顺利。
参考文献:
Hong, Jinseok, et al. "Routing for an on-demand logistics service." Transportation Research Part C: Emerging Technologies 103 (2019): 328-351.