Hightouch如何使用“反向ETL”在仓库和SaaS应用程序之间同步数据?

Hightouch在Amplify Partners牵头的一轮融资中筹资1210万美元,这个平台旨在帮助企业将客户数据从数据仓库同步到CRM、营销及其他众多业务工具中。

现代企业数据堆栈包括各种组件,从数据摄取工具(比如Fivetran)到基于云的数据仓库(比如Snowflake和谷歌的BigQuery),不一而足。通过以这种方式汇集来自多个来源的数据,公司可以运行查询,并生成无法从独立数据孤岛获取的洞察力。一旦数据已经在仓库中,用户需要取出数据,并导入到Salesforce之类的应用程序中,Hightouch在数据工程界就有了用武之地。

因此,虽然Fivetran是许多公司用来将数据“提取、转换和加载”到仓库中的最知名平台之一,Hightouch却恰恰相反,这就是众所周知的“反向 ETL”(reverse ETL)。

图1:Hightouch:将数据从仓库导入到业务应用程序

简单来说,反向ETL就是在表之间复制粘贴数据。比如说,一家公司可能希望将数据从服务台管理平台Zendesk获取到Salesforce。为此,他们可以使用Fivetran将数据导入到仓库,然后使用Hightouch从仓库获取数据并导入到Salesforce。这么做可以帮助销售团队明确一位客户通过Zendesk请求怎样的支持。

Hightouch联合创始人Kashish Gupta告诉媒体:“由于让仓库中的数据更有用,Hightouch 使Fivetran更强大,反之亦然——如果没有Fivetran提供的数据,Hightouch中的许多工作流程将无法实现。”

Hightouch于2018年在旧金山成立,迄今为止三年内积累了众多知名客户。除了与 Nando's和Autotrader等B2C公司合作外,它还与Kong、Plaid和Mattermost等B2B公司合作。

集成式

Hightouch支持众多公司的约60个“目的地”集成,从 ActiveCampaign、Anaplan、Asana、 Amplitude到Facebook、Google Sheets和Marketo,不一而足。该公司还提供“自定义目的地”选项,使用户能够构建自己的Hightouch目的地。而在数据来源方面,Hightouch可以获取来自亚马逊的Redshift、Databricks、谷歌的BigQuery、Looker、Snowflake和Airtable等来源的数据。

Hightouch本身是一个SaaS应用程序,公司可以将其部署在选择的任何云上,允许非数据工程师通过SQL查询数据。Hightouch然后在其UI中将列映射到相应目的地SaaS工具的列。Gupta说:“然后,Hightouch自动实时同步永久有效的数据。”

图2:将“仓库”模型中的字段映射到HubSpot中的相应字段

此外,Hightouch还有一个界面,使企业能够在其他较擅长技术的用户构建的模型之上“可视化过滤”细分市场,这意味着他们本身不必了解任何SQL。

比如说,营销团队可以结合仓库中多个来源的数据,基于“30天内登录并查看过2种产品的所有用户”或“住在纽约市,往购物车添加了电视机的50岁以上的所有人”来开展广告活动。

图3:针对技术含量较低的用户的可视化过滤

据Gupta声称,为了实现Hightouch所提供的功能,许多公司采用的主要现有解决方案是编写Python脚本,并将脚本与Tray或Zapier之类的工具相结合。不过事实上,反向ETL领域还有其他类似的玩家。另一家成立于2018年的旧金山公司Census在几个月前融资1600万美元。Grouparoo和Polytomic等处于早期阶段的公司也崭露头角,它们都在过去的九个月完成了小额种子轮融资。

正如您所料,每种产品都有各自的差异化优势。比如说,Hightouch让非技术用户能够在现有模型之上过滤数据。与此同时,Grouparoo在构建一种开源数据框架。然而,多种价值主张相似的产品几乎在同一时间上市表明了企业需要将内部客户数据与其他无数的业务系统同步。

更宽泛地说,最近数据集成领域动作频频:GitLab将Meltano这个新开源平台作为一家独立公司拆分出来,Dbt Labs(前身是Fishtown Analytics)融资1.5亿美元(估值达15亿美元),可帮助分析员转换仓库中的数据。而Airbyte也在今年获得了风险投资,随后开放其平台以支持数据湖,先从支持亚马逊的S3入手。

然而,Hightouch与这些数据集成平台不一样。事实上,它的技术是互补性的。除了今天的融资外,Hightouch还宣布与Dbt Labs和Fivetran在集成方面建立深度合作伙伴关系,两家公司都会向希望在仓库外使用集体数据的自家用户推荐Hightouch。

开源?

“开源”是涉足更广泛的数据工程领域的许多公司当中的一个共同主题,Grouparoo、Meltano、Dbt Labs和Airbyte都在开源基础上构建商用产品。Hightouch尚未奉行开源理念,但这可能会在未来受到关注。Gupta解释:“我们正在考虑这方面的路线图。我们的客户还没有要求开源。”

最终,Hightouch是一种有别于数据堆栈中其他工具的产品。许多公司可能不是很迫切地在自己的基础设施上托管Hightouch——首先,它本身不存储任何客户数据。Gupta说:“应用程序托管在我们的云中,但数据百分之百驻留在客户的基础设施中。数据直接从客户的数据仓库进入到其自己的云存储桶,然后进入到SaaS工具。因此,我们能够与规模庞大的金融科技和医疗保健客户合作,他们能够证明Hightouch并不对其数据驻留或安全构成额外的风险。”

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,378评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,356评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,702评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,259评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,263评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,036评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,349评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,979评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,469评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,938评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,059评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,703评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,257评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,262评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,501评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,792评论 2 345

推荐阅读更多精彩内容