透过第一手在组织、工具、以及产业中与资料工作的经验,我们发现更好的方式来开发以及交付分析成果及分析工具,我们称这种方式为 DataOps。
不论是在数据科学、数据工程、数据管理、大数据、商业智慧、或其他相关领域,透过我们的工作,将在分析领域建立以下价值观:
个人与互动重于流程与工具
可用的分析重于详尽的文件
与客户合作重于合约协商
实验、迭代以及回应重于大量的前期设计
跨部门的营运所有权重于独立的责任。
DataOps 原则
1. 持续地满足客户需求:
我们最优先的任务是透过及早并持续地交付有价值的分析洞察来满足客户需求,频率可以从数分钟到数个星期。
2. 有价值且可用的分析:
我们相信主要衡量数据分析成效的指标为:具洞察力的分析被交付的程度,包括正确的资料、顶级可靠的架构与系统。
3. 拥抱变化:
竭诚欢迎改变需求,甚至已处开发后期亦然。敏捷流程掌控变更以维护客户的竞争优势。我们相信最有效率、有效、以及最敏捷与客户沟通的方式为面对面的交谈。
4. 这是团队运动:
分析团队将始终具有各种角色,技能,喜欢的工具和头衔。 背景和观点的多样性提高了创新能力和生产力。
5. 每日互动:
客户、分析团队与维运必须在专案全程中天天一起工作。
6. 自组织:
我们相信最好的分析洞察、算法、架构、需求与设计皆来自能自我组织的团队。
7. 减少英雄主义:
对于具备深度及广度的分析洞察需求持续增加,我们相信分析团队应该致力减少英雄主义,并建立永续且可扩张的资料分析团队及流程。
8. 反省:
分析团队应该透过来自客户、团队本身、及运作数据的回馈,定期的自我反省来优化运作效能。
9. 分析即代码:
分析团队使用不同的工具来访问、整合、建模、以及视觉化数据。基本上,这些工具都会产生代码以及设定档,以此来描述操作数据的动作来交付洞察。
10. 编排协作:
数据、工具、程式码、环境及分析团队自始至终的编排协作是交付分析的成功关键。
11. 可再制的结果:
可再制的结果是必须的,因此我们可将任何事情做版本控管,包括數據、低阶软硬体的设定、代码、以及在工具链上各工具的设定。
12. 抛弃式的环境:
我们相信让分析团队的成员有个容易创建、独立、安全、可抛弃、且与生产环境相同的技术环境,并且将其成本最小化是很重要的。
13. 精简:
我们相信持续关注技术优势及良好的设计有助于敏捷;如精简 ─ 最大化未完成的工作量之技艺 ─ 一样根本。
14. 分析即生产:
分析流程如同精实的生产线。我们相信 DataOps 的根本精神之一为专注于程序思维 ─ 达成持续且有效率的生产分析洞察。
15. 品质为一切:
建立好的分析流程应该具备的根本能力为自动(自働化)侦测异常,这些异常包括代码、设定档、以及数据。并且应该能持续地提供维运人员回馈来避免错误发生(防呆)。
16. 监控品质与效能:
我们的目标是有效能以及品质的指标,这些指标可以被持续的监控来侦测无预期的变化,并且产生运作数据。
17. 再使用:
我们相信生产有效率的分析洞察的根本面向在于避免个人或团队的重复性工作。
18. 改进迭代周期:
我们应该减少将客户需求转换成分析想法的时间以及负担:在开发中建立它,以可重复的生产流程来发布,最后再重构及再使用该产品。