感谢公司给与的学习机会,七年之后,又一次去北京参加线下的中国系统架构师大会。
2015年,2016年,连续两年参加了架构师大会。那几年是中国的移动互联网企业最为红火的几年,分享嘉宾有很多业界大神,分享主题甚多,为了听到自己最感兴趣的分享内容,经常要在多个会议室之间来回切换。会场外部也热闹非凡,很多公司有展位,可以注册会员领取个小礼物。在会场提问,可以获得一张图书券,在华章图书的展位免费挑选一本技术书籍。
记忆拉回到现在,前几年口罩不方便,架构师大会在线上举办,没有参加,也不好评判效果。今年回归线下,但是会议现场明显盛况不再。参会的酒店不如之前的酒店富丽堂皇,倒是也不至于寒酸。参会人数粗略估计下,就是300~400人的样子,和之前的4000多人参会的盛况完全不可同日而语。
今年很多嘉宾分享的时候,都在提“降本增效”,国家电网在提,阿里在提、京东在提、爱奇艺也在提。2015年左右是完全听不到类似的词汇的。不能说大家的日子都不好过了,但是可以说大家过的没有以前那么滋润了。个人认为,“降本、增效、提质”都是一些看似正确的伪目标,任何时候都可以拿来高谈阔论,但是不会引导和推动一个行业、一个社会的发展。
2015年的时候,很多嘉宾都在分享各种中间件,kafka,flink,activeMQ,hadoop家族以及基于这些消息组件的高并发业务架构,来自宝岛的嘉宾还会分享GAE的一些应用。2016年,似乎大家都在谈docker、微服务以及服务治理,至今还记得坐我旁边的两个小姐姐在共同diss另外一个女生:“她还没有意识到docker的重要性”。当时还在讨论服务治理是选择Mesos还是k8s,二者基本是难分伯仲。6-7年过去,mesos应该完全没有人在用了。
如果今年的会议没有AIGC相关的主题,可能会相当的无聊。单体还是微服务,ServiceMesh这些不再新潮的知识可能大家还在关注,但是毕竟已经有点过气。
其实,可以想想,从2016年到现在,有没有很多的新理念/新技术/新框架冒出来?DDD算一个,ServiceMesh算一个,但是对业界的影响和docker/微服务那一拨差了很多。
有一位长者曾经说过:“一个人的命运啊,当然要靠自己的奋斗,但是也要考虑历史的进程”。技术成长也一样,你的职业生涯如果正好经历了使用消息中间件、缓存中间件解决大促、秒杀等高并发业务问题,单体服务改造为微服务那些阶段,基本上个人资质不太差,都会在技术领域内有所建树。这些技术问题都解决后,后面的程序员没有那么多的机会去面对和解决这些问题,只是专注于产品开发,成长也会受限。
前面谈了很多感想,下面该谈谈会议的正题了。虽说大会整体效果不如从前,但还是有很多有价值的分享和很多有趣的人。人少也有人少的好处,有了更多的机会和嘉宾1对1讨论问题,自己在产品研发交付过程中遇到的很多问题也有机会和嘉宾们交流。
6-30 会议第一天:
第一个主会场分享:快狗打车CTO 沈剑 《创业公司技术架构与组织架构演进实践》
沈剑老师是一个比较踏实的技术人,最早关注他的时候,他还在58同城。他经营的公众号《架构师之路》干货很多,几乎没有广告和课程推销,这很难得。他分享的提取公共服务屏蔽第三方服务依赖、如何做服务迁移(数据收口、服务收口)、一般服务切换到中台服务、以及对中台服务“厚”薄“的思考,在我最近几年的研发过程中都解决过或思考过类似的问题。比如:在我负责的项目中短信服务、通知服务的设计以及2022年对平台的架构重构,基本是一个思路。至于他在组织架构演进方面的分享,每个企业的现实情况不同,参考意义并不大。
第二个分享的是腾讯云的专家,基本是在推销腾讯云产品,谁叫人家是大会的钻石赞助商呢。
第三个分享的是 酷克数据 杨胜文 《当LLM遇到数据仓库——从数据处理、模型微调到知识增强的应用开发,一切都将变得更容易》
他的主要观点有两个:
1.学术争议不影响LLM应用遍地开花(确实在大会后面的讨论中,有一些对LLM的争议)
2.目前百亿级参数LLM已经具备优秀的语言理解和生成能力。在LLM技术还在快速演进的过程中,相对于千亿级参数模型,百亿级参数模型具有非常明显的成本优势,成为现阶段推动LLM在企业低成本、规模化落地的一个重要选项。
用杨胜文老师更通俗的话表达:“当前阶段,千亿或更大规模参数大模型的调优和演进是科学家的事情,企业把百亿参数的模型用好就够了”。
模型微调等技术简单讲了下,没有讲出太多的细节。
下午并行开展三个专场,
1.多活多云架构设计
2.金融数字化转型
3.分布式与微服务架构的抉择
选择了多活多云架构设计专场,原因:1)对金融数据化转型不感兴趣 2)分布式与微服务架构抉择我觉得已经不成为话题了 3)当前项目中涉及多活多云架构
小红书的专家分享的内容应该是不错,但是演讲能力一般,没太讲明白。F5和vivo的专家分享的内容也很不错,但是自己本身并没有云平台的从业经历,感觉收获并不太大。vivo的架构图画得很不错,可以拿来学习。此外,vivo的服务上云流程管理和我司比较类似。
此外,vivo对智算平台的计费模式也值得借鉴。
15:30后进入圆桌讨论环节,切换到微服务架构专场。
圆桌讨论的好处就是大家比较平等,只要你胆子大,就能得到发问或者表达自己观点的机会。
比较有意思的一些观点:
1.ServiceMesh的发展虽然不及预期,但是一些设计理念和组件还是沉淀了下来。这也符合一般事务/技术的发展规律,刚出现的时候很复杂,只是给出了原理层面上的实现,后来不断发展优化、简化,最终成功商用。或者虽然最终没有整体被业界采用,但是一些过程产物被业界所采纳
2.能够被商用采纳的技术一定是简单、易用的技术
3.架构师或者资深员工一定既要熟悉技术、也要熟悉人性,全面发展自己,整体提升自己的认知水平,做到管理和技术融会贯通。要让你的领导看到你的不一样的特质,不要只是懂那些人人都会的技术,除此之外没有别的竞争优势。
4.作为架构师或者团队Leader,带领不同技术和组织背景的团队交付,给出的架构/技术方案应该是不一样的
5.作为开发人员,其实是比产品经理更熟悉系统的,但是要跳出局部整体思考,要用全局意识
我问了一个问题:由于安全问题,比如nacos和fastjson经常有各种漏洞,每次修复一个漏洞都会涉及几十个微服务的镜像更新,代价很大,请问各位专家对此问题是否有解决方案?
事实证明,这是一个很常见的问题,很多嘉宾都发表了自己的看法,甚至第二天的分享中还有嘉宾对这个问题给出了自己的解决方案。
下午的会议17:30结束,回酒店处理了一会儿工作,晚上8:30打车去附近3公里外的一个商场采购一些北京的特产,商场居然关门了,再次感叹帝都生活的不方便,哪里像大西安,大型的居民区附近基本都有配套的营业到至少23点的大型商场。白白花了打车费从三元桥打车到四元桥,没买到东西,决定和同事走回去,途经一个废弃的黑漆漆的大公园,公园里有很多大树、草木很茂盛,但是缺乏维护,显得很破败。这可是寸土寸金的帝都的三环啊,想不通。
第二天的会议上午9:00开始。
上午是三个专场,
1.海量分布式存储架构设计
2.金融数字化转型
3.容器集群管理与治理
首先选择了海量分布式存储架构设计专场,来自快手的嘉宾分享他们在处理海量小文件方面的一些经验。有一些思路可以借鉴,比如同一目录下文件按一定个数分片管理等。至于分布式存储一致性、数据恢复等内容,听了不太有感觉。
原因:
1.自己的项目的存储的文件体量远没有那么大
2.项目中的分布式文件存储出问题了似乎总是通过重启解决,没有进行深入研究(羞愧)
技术成长就是这样,如果你总是通过一些手段在逃避问题,那么你也别想着在该技术方向有所进步;没有被一个疑难问题折磨几个通宵,没有在外场被客户“追杀”,不可能有技术的精进。
转到金融专场,分享密码基础设施高可用与合规实践,业务性比较强,了解了一些金融行业密码管理的知识。
参与到容器集群管理与治理的圆桌讨论环节,有一些有意思的信息:
1.政府项目通常流量比互联网小很多,但是稳定性要求较高。
2.腾讯云定义了云原生的成熟度模型,并且声称用定制化的serverless容器解决了cgroup的弱隔离问题
3.ServiceMesh的将来可能是无代理网格,因为无代理网格可以解决当前istio网格的弊端:1.性能存在损失 2.资源存在消耗
4.不管服务网格怎么演进,xDS可能已经成为事实的标准
5.云原生遇到的问题要结合业务实际解决,没有标准答案
6.去哪儿网的嘉宾分享通过BizOps做业务关联影响分析,类似的事情2017年我在前东家做过,没有成功,希望他能成功。真正做了这个事情,你会发现产品经理和开发人员能把业务设计和实现得多么不可思议
7.好像是爱奇艺的嘉宾分享了容器化改造的思路和容器失败场景分析思路,比较有启发。其次,他提出了可以用发布成功率,发布时间维度度量云原生的价值。
期间,来自苏研云能的嘉宾分享了国产操作系统、国产芯片的一些知识,与会人员似乎没什么触动。会议结束后,加了这位同事的微信,请教了正在做的国产操作系统切换的一些问题。
下午的专题是本次大会的重头戏,AIGC
首先是联想专家的分享,不太有感觉。
阿里云的专家分享《云原生AI+Serverless K8s,为大语言模型创新提速》,和我当前做的产品相关度很高。比如模型/大模型部署方面的考量,MLOps的实践。
阿里云的专家很有诚意,准备的材料内容很丰富,时间关系,很多内容没充分讲出来,拿到PPT后再好好学习吧。
接下来是地震局地球物理研究所的一位嘉宾分享,一上来就来了一句:“我只讲深度学习以及各种算法,不想玩什么AIGC的概念”。分享过程中一直在强调科研和企业开发的不同,中间数次diss了菊花司,大意是花架子不中用,充满了国家队的优越感。还是能感觉到他确实是有一定实力,但是“文人相轻”真是没有必要。
进入圆桌讨论环节,出现了有意思的一幕,嘉宾发言环节,一位本不是嘉宾的参会者坐到了嘉宾的位置,主动表达的自己的观点:
“我是一位大学教师,我觉得AIGC没有什么深奥的,在人工智能领域还是很表层的研究,和数学、物理的发展阶段还相差很远”。他分析,AIGC就是构建了一个大矩阵,然后通过矩阵运算计算相似性,基本就是泛函分析学科涵盖的内容。《泛函分析》课程非数学专业是不学的,我在大学时代在图书馆借阅过一些书籍学习过,基本也全忘了,不好做评价。
讲完之后,直接背包离场了,颇有一种“事了拂衣去,深藏身与名”的大侠风范。
然后是京东的一位专家发言,讲了很久当前互联网上AIGC的科普知识,坐我对面的一个小伙子都睡着了。
大神才走,又来一位中科大的大神,看图就知道:
最终,他把话题引到了量子计算,认为只有量子计算才能解决AI领域的巨大计算量。可能他是对的吧,但是总有一种“遇事不决,量子力学”的既视感。
轮到蔡龙军发言,这是个大神,他主要表达了几个观点:
1.碳基生物的最大成就是创造了程序员,程序员创造了硅基生物,硅基生物将成为未来世界的主宰。
2.依赖小模型,全面拥抱大模型(小模型为大模型积累预料)
3.在大模型的应用场景下,存储和计算的边界开始模糊
4.当前的重点是建立场景化的大模型应用落地闭环机制
5.AI会让产品多元化、带来普惠性(举了个例子,当前大街上跑的汽车种类很有限,不是人类对汽车的需求就那么多,而是汽车的工业化水平只能达到那个程度)
6.AI模型的“遗忘问题”和“幻觉问题”将很快得到真正解决
蔡龙军分享完,已经是下午17:10了,要赶在19:00前到北京西站返回西安,只有提前20分钟离开了。
总体来说,参加SACC2023还是很有收获的,2023年的夏天,从炎热的西安到更加炎热的北京,不虚此行。