你好,我是强哥,这是我的154/160的进化日课。 这一段时间,我跟一些字节的朋友交流,他们提到的最多第一个词是善意假设,大幅提高了工作效率。 不少传统企业常不自觉着眼于“人...
你好,我是强哥,这是我的154/160的进化日课。 这一段时间,我跟一些字节的朋友交流,他们提到的最多第一个词是善意假设,大幅提高了工作效率。 不少传统企业常不自觉着眼于“人...
原文地址:MapReduce Input Split(输入分/切片)详解 结论: 经过以上的分析,在设置map个数的时候,可以简单的总结为以下几点:(1)如果想增加map个数...
hive sql在使用中会经常 碰到去除重复数据的操作,一般来说一个关键字distinct就可以解决,但是distinct的使用场景限制比较多,它是对所选取的所有字段进行比对...
Neil Zhu,简书ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增...
索引模板,简而言之,是一种复用机制,就像一些项目的开发框架如 Laravel 一样,省去了大量的重复,体力劳动。当新建一个 Elasticsearch 索引时,自动匹配模板,...
什么是MySQL? MySQL 是一种关系型数据库,在Java企业级开发中非常常用,因为 MySQL 是开源免费的,并且方便扩展。阿里巴巴数据库系统也大量用到了 MySQL,...
Total shards per node The cluster-level shard allocator tries to spread the shards of a...
调优之前是将功能实现...然后算法优化,设计优化,再是spark调优!,需得一步一步来,不得直接越过,直接调优! executor调优 对于exector的调优基于一个原则,...
Git1.7.0以后加入了Sparse Checkout模式,该模式可以实现Check Out指定文件或者文件夹举个例子:现在有一个test仓库 ssh://git@gith...
网站 1.DDD社区http://dddcommunity.org/ 2.汤雪华的博客http://www.cnblogs.com/netfocus 3.如何一步一步用DDD...
DDD大家讨论的比较多的一般都是DDD的思想和理论,很少有文章讨论具体是如何实施和落地,所以这也导致很多同学看完了Evans经典巨著后对DDD还是不知道如何去实施。这篇文章我...
最近在做一些微服务相关的设计,内容包括服务的划分,Restful API的设计等。其中比较棘手的就是Service的职责划分:如何抽象具有统一业务范畴的Model,使其模块化...
首先来看离线构建部分。从图中可以看出,左侧为数据源,目前Kylin默认的数据源是Apache Hive,保存着待分析的用户数据。根据元数据的定义,构建引擎从数据源抽取数据,并...