昨天下线之前没有抵受住OW的诱惑,和浩雪打了几场快速(毕竟最近都是单排玩),所以睡得就很晚……今天也比较困!地铁上继续玩火纹,难度感觉越来越低是好事【
上午在原来的工位上尽情一边划水一边工作,按照周末在家里笔记本上的步骤成功把办公电脑也装上了pyspark等各种环境。
中午久违吃食堂。
下午去开会,认识了几个新同事(似乎我们公司有一堆人是华为淘汰[x]下来的?),然后一起确认任务流程。轮到我时简单介绍了自己目前的工作,然后经过讨论确认了用python的sklearn去实现spark分布式计算确实不太好用,所以还是决定直接用自带的MLLIB。之后确认下周或者下下周要去广州出差,大概也是半个月(。)
之后的时间简单实现了一个基于MLLIB的聚类算法,未来几天的任务就是了解spark的工作原理,以及MLLIB的一些基本语法了……最终目标是在出差前虚构一个大数据集,然后观察MLLIB的计算效率?
到家后上FF14给A酱做了点分解材料,然后OW找不到人又因为害怕沉迷不太敢ACRG,所以只能玩FM(FM就不会沉迷吗?!)。
明天主要还是继续研究MLLIB啦,要弄明白怎么让它在分布式环境下运行。