2018.2.13建模over,在泉州度假了七天。
队伍换了一人,由原来的阿奔换成了可爱的亦隽。去年啊,阿奔给我讲了四天四夜的笑话,可惜其今年工作便没有一起玩比赛了。今年,我倒是代替了阿奔的角色,让两个学弟这七天成为他们这学期最为开心的一段经历,可爱的亦隽嚷着要和我一起旅行<-,嗯,祝他能成功追上他暗恋两三年的女生。
今年其实是比去年有更大的期待的,毕竟去年只是ctr+c ctr+v就拿了个二等奖的。而如今,乾坤经历了美赛国赛的洗礼,对于建模也很熟悉,而我在折腾数据分析 机器学习这些,加上亦隽这个要出国的,成天啃英语,还有翻译证书的大佬。
那个F或者O奖应该会是不难的吧。
然而结果却是感觉比去年还糟糕,因为论文写的一塌糊涂。5个task只正儿八经的搞了1个,剩余四个task连瞎掰都懒得瞎掰,随便凑了两页(参赛论文共20页)。最后还是用恶心的word排版,(我已经两年多不用word了的啊,要么markdown要么LaTeX)。之所以不用LaTeX是因为有半年多没用,之前语法又不熟,搞完模型就剩几个小时了,回想起去年参赛用Ctex出的幺蛾子就害怕,毕竟去年差点论文都交不成了,临时装的Texlive 和Texstudio 编译了几下又是乱码。
本次比赛从两位学弟身上学到很多东西,我是性格很随意的,对于比赛题目的解决都是按感觉走,想到啥就说啥,无法解决就靠瞎掰,一梭哈的搞完就好了。然而两个学弟对于问题的解决却是很较真,气的我都想骂他们是榆木脑袋。 每次我提出一个自以为还可以的解决方向,就丢给他们,认为可以轻松解决,然而他们却会考量各个因素,数据的可靠性、逻辑的严谨性等等。凭借着去年的经验,我只想一梭哈把问题给解决了,然后花一天时间改(凑)论文,所以跟他们不在一条线上。最后造成了如上所述的景象,光顾着建模却并未考虑task的展开。
亦隽比赛期间很认真了,认真研读了很多英文的文献,还有多篇往年O奖论文。然后对他所写的的每一句话都要认真推敲。反观我,英文的文献和论文都不想看,瞄一眼就算跳过,写的英语句子自己都不想看,搞得我两三个句子他要搞半个小时才能捋顺。
乾坤做事一如既往的靠谱,兜底的绝佳队友。今年如此,去年也是如此!模型学的快,去年搞汽车仿真模拟,学元胞自动机,搞得有模有样。可惜碰上我这么随意的队友,加上我那随意的解决方向,真对不住乾坤了。今年他更是火力全开,搞BP nerual network模型,然后优化BP模型,最后几个小时,一个人撸完我和亦隽已经放弃的task3 和task5。然后他研究了好久的风险模型、干预能力模型都因为时间原因加上我嫌麻烦,给弄泡汤了。
两个实力队友,今年比去年还多熬夜了一个晚上呢,感觉结果却会比去年更糟糕。锅自然在我这个leader上。
但结果貌似不重要了。
我学东西,以及对于问题的看法一向浅尝辄止,这个毛病贯穿了我涉猎的各个领域,因而学了很多东西,却无一有结果,或者坚持下来。比如LaTeX,正因为只学了皮毛,一旦半年没用便沦为彻底的小白。
从两位学弟身上,我看到了潜心研究一个问题的那种光芒,而这正是自己所期待的和缺乏的。比如乾坤的算法、模型底子并没有我那么好,然而真正要搞算法、模型时却学的比我快多了也深入多了,因为他能够静下心来去研究文献,然后跑代码,耐心调参。
虽然老是笑亦隽经常钻牛角尖,但他提出的问题也确实是合理的,他那种牛犊子性格在做事时也是不可或缺的。
当然了,比起去年也有很大的进步。
去年对着参考文献抄公式抄数据,才凑了15页,最后只好用Google翻译插入了一个中文模型,数据图片都是截屏的。
今年却是实打实的找数据,然后跑模型,考虑到变量间因果关系,用交互项优化模型。以及前期的数据清洗 数据填充 数据可视化,都是用代码弄出来的。也正是因为建模太high了,Task1的model完成后就有可怕的25页之多了!!!
并且,在比赛快结束的时候,发现randomForest处理这个问题有奇效,最后忍不住在动车上跑了一圈代码⊙⊙。
比赛总的经验和教训,其一作为总舵手如何去把握总体的方向,每人都有自己的角度与看法,如何去协调三人处理问题的节奏,使三人在同一条线上解决问题;其二则是当自身对这个问题只是很浅的看法时,提出的方向会使得团队一团糟,因而应该慎重的去提出一个方向,不能随意;其三处理问题很随意,参考文献随缘插入;对于方案的提出也是基于感觉;模型瞎JB乱套。而一旦比赛换成一个实际产品的建模,每一个细节都应该考虑到,不能模糊的去解决。
一个实际产品的建模,其复杂程度比起比赛只高不低。
与往常一样,附上队友照片。
本次赛题是建立一个与climate change有关的国家脆弱性模型,并附上前天熬夜所写的粗糙Model。hmmn,英语惨不忍睹。
以及去年的参赛经历与介绍,搬砖大赛。