Databricks收购了以AI为中心的数据治理平台Okera
Databricks收购了以AI为中心的数据治理平台Okera
2023年5月5日
分布式实验室
803

Databricks 宣布收购了 Okera,这是一个专注于 AI 的数据治理平台。两家公司没有透露交易价格。根据 Crunchbase 的数据显示,Okera 此前共筹集了近 3000 万美元。投资者包括 Felicis、贝塞默风险投资公司、Cyber Mentor Fund、ClearSky 和 Emergent Ventures。数据治理一直是一个热门话题,Databricks 在今天的公告中指出,最近对 AI 的关注突显了之前处理数据治理的方法存在不足。公司在一篇博客文章中解释道:“从历史上看,各种数据治理技术,无论多先进,都依赖于在某个狭窄的层面上实施控制,并且要求工作负载适应这个层面的‘围墙花园’。” 然而,在大语言模型(LLM)时代,这种方法已经不再奏效,原因有两个:一是资产数量增长过快(部分原因是大量的机器生成内容),二是 AI 整体格局变化迅速,标准访问控制无法足够快地捕捉到这些变化。Okera 使用了一个 AI 驱动的系统,能够自动发现和分类个人身份信息,对其进行标记并应用规则(重点关注元数据),同时采用了一个无代码界面。正如 Databricks 团队所强调,公司对收购 Okera 感兴趣的一个原因是其自动发现和分类个人身份信息的功能,另一个原因是该服务的隔离技术,它可以在不产生重大开销的情况下对任意工作负载实施治理控制。这项技术目前仍处于内部预览阶段,但极有可能是 Databricks 收购这家公司的主要原因之一。Databricks 在几周前推出了自己的大型语言模型,现在计划将 Okera 的技术整合到其 Unity Catalog 中,这是一种现有的数据和 AI 资产治理解决方案。公司还提到,此次收购将使 Databricks 能够公开更多 API,供其数据治理合作伙伴使用,从而为客户提供解决方案。随着此次收购,Databricks 还吸纳了 Okera 的联合创始人兼 CEO Nong Li。Nong Li 是 Apache Parquet 数据存储格式的创造者,在加入 Cloudera 工作以及创建 Okera 之前,他曾在 Databricks 短暂的担任过工程师。他是 Okera 的创始 CTO,并在 2022 年 2 月担任 CEO。在今天的公告中,Nong Li 写道:“随着数据在各种应用中的数量、速度和种类不断增长,CIO、CDO 和各领域的 CEO 需要平衡这两个通常相互矛盾的任务,更别说历史上在多个云环境中管理访问策略是费时且令人痛苦的。许多组织没有足够的技术人才来大规模管理访问策略,尤其是在大语言模型蓬勃发展的今天。他们需要的是一个现代化、以 AI 为核心的治理解决方案。我们为能加入 Databricks 团队感到非常兴奋,将我们在为一些全球最具前瞻性的企业构建安全、可扩展且简单的治理解决方案方面的专长带给他们。”

- 感谢作者 -
以上内容版权归作者所有,
转载请征得作者方面同意并标注来源。
资讯内容不构成投资建议,
投资者应独立决策并自行承担风险。
加载中...