估值380亿美元的数据湖引领者,Databricks是如何发展壮大的? DATE: 2024-05-05 08:10:18
阿尔法公社
重度帮助创业者的估值天使投资基金
━━━━━━
阿尔法公社说 :Databricks起步于加州伯克利的开源项目,由多位科学家创业者创立 ,亿美元经过多年发展 ,数据目前是湖引何估值380亿美元的超级独角兽 。它的展壮联合创始人兼CEO ,Ali Ghodsi接受了投资人Matt Turck访谈,估值详细谈了Databricks从0到380亿美元的亿美元发展壮大历程,包括如何做产品,数据如何进入市场,湖引何如何管好团队,展壮以及他作为领导者的估值修炼过程,欢迎创业者们参考。亿美元
Databricks是数据一家正在崛起的企业软件巨头 。2021年,湖引何它连续获得两轮10亿美元级别的展壮大额融资,估值跃升到380亿美元,它在数据和人工智能领域具有全球雄心 。
Databricks是一个非典型的创业故事,它由七位联合创始人创办,其中大部分是学者 。它从Spark开源项目起步,现在引领了数据湖范式 ,这将加速其与主要竞争对手Snowflake的竞争。
本文是投资人Matt Turck与Databricks联合创始人兼CEO Ali Ghodsi的对话实录,Matt Turck在2015年就与Databricks的联合创始人Ion Stoica有过对话,对于Databricks的情况相当熟悉 。在本文中Ali Ghodsi将透露Databricks从一个开源项目到大型公司的成长经历,以及在团队,产品 ,进入市场,扩张等方面积累的洞见,Enjoy 。
科学家创始人们推动Databricks起步
Matt Turck:我们谈一下Databricks的起步 ,AMPLab、Spark和Databricks,这一切是如何开始的?
Ali Ghodsi:我们当时正处于人工智能革新的风口浪尖:Uber刚刚起步,Airbnb、Twitter处于早期 ,Facebook还不是巨头 。他们声称,使用20世纪70年代诞生的机器学习算法实现了很好的效果。
以当时的常识来想这不可能是真的,我们觉得那些算法不可能Work,但他们说,“不,我们得到了非常厉害的结果。”当仔细观察后,我们的想法被颠覆了——他们确实获得了惊人的结果 。以现代硬件和大量数据为支撑 ,运用上世纪的算法依旧可以获得令人难以置信的产出,我们对此感到震惊 。我们想:"需要使之普适化"。例如 ,在Facebook ,他们可以提前检测到情侣分手 ,如果地球上的每个企业都有这种技术 ,这会对现有商业产生巨大影响 。这就是AMPLab的起点 。
Matt Turck:当时AMPLab的Spark是怎么来的?
Ali Ghodsi:图灵奖得主之一戴夫·帕特森当时是伯克利的教授,他非常相信人们应该聚在一起 ,打破孤岛。伯克利的教授们放弃了自己的私人办公室,和所有学生一起在巨大的开放区域办公 。
他们试图解决的机器学习问题以当时的技术背景来说是很有挑战性的。AMPLab里做机器学习的人,做数学的人 ,不得不使用Hadoop ,数据的每一次迭代都必须运行MapReduce ,这样光是做一次迭代就需要20到30分钟 。所以当时我们决定:"联合起来 ,建立一个反应快速的基础架构。”我们在数据上做了很多迭代。因此,不只是做一次 ,不只是一个SQL引擎,而是可以做递归机器学习的东西,并可以极快地找到数据中的内涵模式。
Matt Turck :Databricks创始故事的特殊之处在于,你们有七 、八个联合创始人 。回过头看,拥有这样一个大的创始团队利与弊是什么?
Ali Ghodsi:肯定是有利有弊的。如果你知道如何真正让由七个人组成的紧密小组真正信任对方 ,并在一起工作得很好,就会发生令人惊讶的事情 。我认为Databricks的成功很大程度上归因于我们互相的信任。
创业早期的创始人 ,即使只有两个人,他们也会争吵,然后可能会在一两年内分裂,这就是问题所在。我们找到了一种方法,使大家真正了解对方的长处和短处 ,使这段创业旅程成为一种乐趣 。
人们总说CEO是地球上最漫长的工作 ,我从来没有这种感觉。我有很多联合创始人和我在一起 ,他们一直都在,这对我们来说绝对是一种力量 。如果我们没有这些人,就不会有现在的成就 。