微软近日宣布收购AI数据工程平台Osmos,旨在增强其Fabric数据平台的功能,此举也意味着微软开始向合作伙伴的市场领域扩张。
Osmos成立于2019年,该公司已在基于开源Apache Spark的Fabric平台上提供数据管道和上传产品。微软Azure数据分析企业副总裁Bogdan Crivat在博客文章中表示,此次收购将支持Fabric的使命,为客户提供"将所有数据和分析统一到单一安全平台"的解决方案。
Crivat表示:"通过收购Osmos,我们正朝着自主AI智能体与人类协同工作的未来迈出下一步,这将帮助减少运营开销,让客户更容易地在整个组织内连接、准备、分析和共享数据。"
微软产品高级总监Roy Hasson在单独声明中表示,此次收购将通过AI技术简化基于Apache Spark的提取-转换-加载(ETL)数据工程任务。他在社交媒体上发布的帖子中提到:"近两年前,Osmos在微软Fabric上推出了AI数据处理器和AI数据工程智能体作为原生应用,使客户能够快速解包、转换和处理复杂的非结构化或半结构化数据,转换为存储在微软数据湖OneLake中的即用型Iceberg表。"
Hasson还表示:"我们很快意识到客户喜欢在Fabric Spark之上使用Osmos,这将他们的开发和维护工作量减少了50%。"
这一声明暗示了微软数据平台策略重点的转变。Fabric数据平台于2023年末推出,当时严重依赖来自Databricks的开源技术。Databricks与微软保持密切合作,并将其产品深度集成到Azure云平台中。
Databricks最初基于开源Spark构建,但后来已经扩展到其他领域。两家公司紧密集成的一个例子是微软的镜像数据复制功能,它将外部数据库的快照以Delta Parquet格式传输到OneLake。Delta Parquet是一种开源表格格式,最初由Databricks开发,是Iceberg的竞争对手。微软最初将Delta作为Fabric上的首选表格格式,尽管它也支持Iceberg,而Databricks希望长期将Iceberg与Delta集成。
随着收购Osmos,微软的重点正在从Delta和Databricks转移。Databricks在Azure上也提供自动化ETL工具,现在必须与另一个微软旗下的产品竞争。
Osmos联合创始人兼首席执行官Kirat Pandya是微软和谷歌的资深人士。2021年,Osmos获得了1300万美元的融资,由光速创投合伙人Raviraj Jain领投,CRV、Pear和SV Angel参与投资。微软收购的具体金额未披露。
Q&A
Q1:Osmos是什么?它能为微软Fabric带来什么功能?
A:Osmos是一个AI辅助的数据工程平台,成立于2019年。它能为微软Fabric带来AI数据处理和智能数据工程功能,帮助客户快速处理复杂的非结构化数据,将开发和维护工作量减少50%。
Q2:微软收购Osmos对Databricks意味着什么?
A:这意味着微软数据平台策略的重点转变。Databricks原本与微软保持密切合作,在Azure上提供自动化ETL工具,但现在必须与微软旗下的Osmos产品竞争,两家公司的合作关系可能会发生变化。
Q3:Osmos的AI数据工程智能体有什么具体优势?
A:Osmos的AI数据工程智能体能够自动处理提取-转换-加载(ETL)任务,帮助客户快速解包、转换复杂的非结构化或半结构化数据,转换为即用型数据表,大大减少了人工操作和维护成本。