您好,欢迎光临国民财富官网!

新闻中心

NEWS CENTER

国民研究

达晨财智窦勇:浅析大数据产业投资

更新时间:2019-02-06

达晨财智是一家比较传统的VC机构。自2000年成立以来,达晨累计投资企业达467家,资金管理规模250亿人民币,IPO上市75家,新三板挂牌91家。


如图所示,我们团队在大数据行业布局了6大领域:数据规划、数据源、数据存储、数据应用、可视化和数据安全。共计30个项目,整体的投资金额在10个亿左右。幸运的是,在我们投完之后,这些企业的次轮融资金额和融资幅度都出现了大规模增长,当然这只是一个账面价值。

2云计算vs大数据vs人工智能

开始今天的第一个议题:浅析大数据与云计算、人工智能之间的区别。

2.1

云计算

从定义来看,云计算,只是解决一个问题——资源的管理。什么样的资源呢?三个方面,一是计算资源,二是存储,三是网络资源。


我们都知道,物理机一开始出现的时候,就好比我自己家里要买一台服务器,你肯定会关注三个东西:CPU、内存和网络。那么,是不是把很多的物理机集中在一起,就形成IDC中心了呢?这里需要用到国外的一个叫VMware的虚拟软件。它通过组网把多台物理机连接在了一起,就形成了IDC中心。下一步是云计算。现在的云计算很简单,我只要一个账号,我需要多少网络计算资源和存储资源,包括网络通信资源,都是随时给你的,它就充分实现了资源的弹性,也就是所谓的时间的灵活性和空间的灵活性。但是当虚拟软件VMware刚开始出来的时候,虽然它解决了时间的灵活性,却没有解决空间的灵活性。这是什么概念呢?虽然我们都知道虚拟机可以在数据中心去解决数据的部署,但是当时懂它的脚本的人极少。于是通过算法,也就是所谓的调度,通过计算机自己的算法去分配,我这个数据中心中几百台或者上千台服务器它什么时间点去分享自己的共享资源,这样就解决了云计算的空间问题。在这个领域比较出名的一家企业叫VMware,非常赚钱。因为你不需要跑客户销售了,你需要计算资源,你找我,我给你个账号就行了。但是世界上技术大牛太多了,想要做到技术完全领先是不可能的。那你闭源,我就搞开源的东西,所以后面就出现了闭源解决方案,也就是所谓的云计算最底层——IaaS层,也就是计算资源的管理架构。所谓IaaS层,就是我要把所有的服务器,我所需要的计算资源管起来。

云资源不能只管计算资源,还要管跑在上面的应用。通过在计算资源接口上加一个PaaS层,能达到两个目的:一是把计算资源管起来;二是把上面应用的部分管起来。PaaS层,承上是要把物理世界的机器管起来,承下就是把上面的应用管起来。

云的形态现在有几种:私有云、公有云和混合云。简单来讲,我有钱,我把服务器建在自己家里面,那就是私有云,不对外开放;如果像亚马逊、微软这类做运营平台的,他把服务器建在自己中心里面,那这就是公有云;很多企业现在是混合云,什么概念呢?可能一些核心的数据资产必须要自建服务器,但是像OA或者门户网站这些,东西可以放在公有云上面,这样就可以降低成本。

亚马逊这家公司,很多人认为它是一个电商平台。但是你看它2017年的财报,它的125亿美金的云销售平台业务,其中有31亿美金是净利润,那它其实是一个大的云平台厂商。它的开源就开发了虚拟软件技术,但是闭源就把云化的东西给你锁死了,作为它自己的核心技术。那这个怎么办呢?在美国还有一家公司叫Rackspace,这家公司起步比较晚,行业内排名第二。他联合了美国航空航天局,共同研发了OpenStack——一个开源的云计算管理平台项目。随着后续所有的软件厂商都加入了公有云平台,OpenStack逐渐成为了行业技术标准。OpenStack充分实现了公有云资源的时间、空间的灵活性,实现了计算、存储、网络资源的弹性。

通俗地讲,云计算就是把所有闲置的服务器通过一定的技术,让所有想要的人在任何时间点、在任何空间获取你所需要的云计算成本。

2.2大数据

我们回到今天的主题——大数据,它跟云计算有什么关系呢?我们先讲讲大数据是什么。

我个人认为,数据本身并不具备价值,只能获取信息,信息经过整理才能成为知识,知识经过应用才能诞生智慧。所以“大数据”这个概念提起来很新,但其实里面有这样的一个逻辑。这里面讲两个因素吧。“驱动大数据技术”这个词最近被炒得很热,它包括两个方面:一个是计算性能的提升,一个是存储成本的降低。这两个因素驱动着整个产业不断地更新迭代。


我们先看一下国外。21世纪互联网经济之前,没有承载这些数据的载体的时候,没有存储收集这些数据工具的时候,那时候的信息化尚未完成,数据量较少。直到2005年,雅虎为了解决网页搜索的问题,成立了一个攻关小组。小组项目最后是失败了,但沉淀下来了两大核心技术,一是高性能计算,二是分布式存储。这两项技术出来了以后,沉寂了一段时间,因为这个行业不是一直往上走。真正引起轰动的是2009年Splunk上市的时候,当天的股价溢价高达39%,一下子引起了整个投资界轰动。美国最有名的事件之一,就是Plantir这件事情。它疯狂的是什么呢?没有上市的一家公司,估值却高达200亿美金。而实际上它并不神秘。Plantir一开始是被美国中央情报局CIA定点扶持的企业,就是帮CIA抓人。比较有标志性的事件,就是本拉登的位置线索。他提供了一些算法,或者隐形数据分析。这个事件对于整个国内大数据的发展起到了非常强的促进作用。

那我们反过来再看看国内的情况。在2013年之前,大数据尚处在萌芽阶段。中国人喜欢用五年来设定一个周期。2013年-2017年12月9日,为什么是这个点呢?等会再跟你说。这个时间,我们称之为“数据1.0时代”。这个时代,我们认为还是市场认知的时代。这个阶段由于有一些资本的加入,在行业里有泡沫,就存在着挂羊头卖狗肉,所谓的号称是大数据的企业。因为有了资本的注入和驱动,当时整个行业技术出现了很多创新,所以这个时代是相对混乱的时代。2016年下半年到2017年12月9日之前,整个大数据产业都比较低迷。为什么是12月9日呢?这一天习大大召集了七部委常委,梅宏院士发表了一篇论文。当天习大大明确指出了,要以数据治国,在这个一个场景提到了数据的应用。这样一个时间点,对大数据这个事情有了非常明确的政府导向性的东西。这样的情况下,整个行业才逐渐恢复起来。如果从那个时间点来界定,也就是数据2.0时代。现在市场上提“大数据”的企业不多了,大家提什么呢?往“人工智能”、“深度学习”这些方面来了。从技术路径来说,大数据这个东西不复杂。大数据很大,散落的数据要通过收集、传输、存储、处理、分析、检索、挖掘、应用等一系列环节来进行专业化处理。用一句话来解释,大数据的本质就是一台机器干不完的事情,利用多台机器同时完成。大数据需要云计算提供平台支撑算力,云计算需要大数据进行落地应用。所以这两者之间是你中有我、我中有你的关系。

2.3人工智能

接下来,我们再讲讲人工智能。

“人工智能”这个词也很热,现在标榜AI的企业也很多。其实人工智能这个事并不复杂。在很多年以前,就是人总是想自己变得更舒适、更偷懒,所以就发布了很多的想法。一开始的技术路径,是教机器,就是人脑类机器。类机器是什么意思?要把人的思维教给机器。怎么教呢?首先,教一些知识和算法。这里面有一个故事很搞笑,是什么呢?一开始叫推理能力,叫数据推理,逻辑推论,因为它有很强的规则性,机器很容易学。反过来出现自然语言,有这样一个很搞笑的例子,如果你女朋友对你说“如果你早来,我没来,你等着”,“如果我早来,你没来,你等着。”机器就傻眼了,它不知道你要干吗。这就是所谓NLP(自然语言处理)的解析问题。在美国NLP创业公司很多,国内很少,为什么呢?这个很难。第二个就是,逻辑学会了,机器得教知识,但是一个很大的问题,书面语可以,比如说“赵总,下午请您到什么什么地方。”有规则、有自定义的,那机器很容易学。但是你不能每次拿着手机都说“赵总,您好!…”这样的,是不是大家都很别扭?所以在过去几十年之中,证明这种路径,所谓的人工智能不行,技术路线上行不通。

那好,人都是聪明的,那干什么呢?就诞生了神经网络,神经元。什么叫神经网络?大家想象一下,有一种非常神奇的函数,这个函数我也不知道长什么样,但是我们每天固定输入一个值的时候,它可以输出我希望得到的结果。如果这个结果跟我输入的期望有相差的时候,它可以自定义去调整。这就是美国几个哥们干起来的,而且干得不错,实现了。但是你想象没有,人的大脑里面有多少个神经元,太多了。那这些神经元想达到我期望值的时候,离不开什么?离不开数据。所以为什么说眼下的人工智能在行业落地的时候会非常麻烦呢,因为他缺少高精度的数据。可能有人感受得到的,提得最多的AI是在医疗领域的应用,但坦白来讲,你去看病,拿CT片给医生看,他只能是让人工医疗代替他30%-40%的劳动力是可以的,完全交给机器,估计没有哪一个医生敢打保票说,就让它看了,没问题,这个就过了。他不敢。因为什么呢?精度不够,这是医生的职责所在,他不敢把这个完全交给机器,要承担责任的。机器类人脑使得机器拥有人心的日子变得不再漫长,诸多神经元需要大量的数据作为计算支撑。未来再经过两三年的时间迭代,随着我们更多的数据源的开放、流转,这个事情就会变得不那么复杂。

前面这一段时间是给大家解析三个词:云计算、大数据和人工智能,这三者之间是你中有我,我中有你,谁都离不开谁。所以你会看到有些云计算厂商,他也有大数据平台,有些大数据平台的企业做着做着他也会想我会调用云计算,有一些私有云,或者公有云的厂商跟我合作;人工智能,现在为什么不提呢?现在市面上因为资本的热点不在大数据本身,都在讲人工智能。

3

投资逻辑和估值体系

前面是谈一些概念。接下来,我们再讲一讲投资逻辑跟估值体系。

3.1数据1.0:英雄辈出的时代

我们还是回到定义来看吧。数据1.0时代,是一个英雄辈出的时代。从产业的角度来看,数据1.0时代的时期它实现了数据格式的多样化:结构化数据、异构化数据和半结构数据。这三种形式的存在,导致了大量的信息得以被挖掘,规律得以被总结,行业应用变得越来越朴实。而从投资的角度来看,无非是三种:

一、传统的IT/系统集成商。传统的IT技术厂商因为距离客户较近,所以能够理解客户的需求,但长期的系统集成厂商的背景导致他们往往有着极强的IT背景。现在转换为DT公司,往往形式大于内容,传统的IT集成的整体估值,在转换为DT之后没有3到5倍的溢价,这些创业公司自己都不好意思对投资人融资。这些案例我们见到了很多。后面有案例与大家分享。如果真的对他进行解剖,其实真的什么也不是。

二、拥有稀缺数据资源的厂商。在数据1.0时代为什么会这么存在呢?中国是一个人情社会,有些企业,或者有些个人,有某些渠道,他能获得政府授权的一些公开数据,比如说像企查查、天眼查,工商所有的数据,当然人家怎么来的,也是通过合规合法手段获取这些数据的。不是说这些人不行,在数据1.0时代,拥有数据者为王。在过去五年,认为,我有几PB,或者有10PB数据,真厉害。因为那是一种矿,我有了这个矿,我想怎么挖、什么时候挖,那是后面的事情。

三、具备技术的创业团队。这就在我们周围,从中国的大数据产业分布来看,70%在北京,北京的70%又在中关村周围,为什么呢?这边有北大、清华,一堆的高校创业者人才。

3.2数据1.0:差异化显现的时代

在数据1.0时代,这三类企业是并存的。第二个就是差异化显现的时代。

一、消费大数据。大数据很大,如果我们把它分门别类来看,我觉得消费大数据是最快的,为什么呢?因为这个领域非常简单,运营商数据、互联网数据比较容易获得。那个时候爬虫还是比较新鲜的一个技术,几十个爬虫互联网上一爬,全网数据全拿下来。然后精准营销,给客户推。消费大数据里面诞生了一些很牛叉的公司,这个领域是最快的,也是创业者最多的,因为它有完整的数据变现通道,也有完整的整个数据的采集、归纳、整理,到数据折现的一个完整的产业链。

二、机器大数据。我们讲一个现实的例子,所有的企业里都有一个信息化系统,但是信息化系统由谁来管?原来没有云的时候,有一个所谓的服务器,服务器在管理这些运营商的时候,它自己也会产生数据,也就是机器数据。也就是刚才美国第一家,也就是splank上市公司,它就是做机器的数据分析的。国内也有一家对标的企业,活得还好,但是这个行业里面也有大的买家,像银行、政府机关这些可以去买,一般企业主不会,那坏就坏了,服务商能给我提供就行了。

三、工业大数据。2016年以前处于萌芽阶段。前几年在这个领域做的人很少,为什么呢?有两个问题。第一,工业领域很零散,每个行业都不一样;第二,缺人。缺什么样的人?懂IT的人不懂工业,懂工业的人不懂IT、不懂大数据。因为大家都盯着消费大数据,为什么呢?跟银行变现,跟金融体系去变现,那容易,高大上,很快,数据也容易获取,大家拼的是技术。工业里面,谁愿意跑到工厂底层,高温设备厂商里面去,你去到那里看看,高温、潮湿、噪音都来了,所以这里面的人非常少;第二个呢,工业里面有一个非常致命的问题,它的数据并发量不比“双11”少,工业大数据设备连接越来越多的时候,它是7×24小时的,所以这里面很难的一个点,就是所谓的时空数据库,怎么解决这个点,现在市面上没有比较好的成熟的案例。但是现在国家在提这个,所以这个热点可能在今年开始,以工业互联上市为主,前几年可能比较沉默。说实话,买它的人不多,因为你要做数据平台的企业,可能在这个行业里面你的产能都得在100亿以上,那这样的企业央企比较多。如果没有12月9日一纸命令下来,那你想想看这个领域的沉寂还是比较长的。但这个事值得干,市场空间也大,因为这里面涉及的东西比较多。首先,这些散落在市场空间的物理设备,你怎么把数据采上来?这第一个问题就已经难倒很多人。而设备厂商,到底是通过无线WiFi传输,还是通过4G的网络传输呢。这里面有很多的技术手段要一点点的去解决,而工业大数据只是这个产业链最终端皇冠上的明珠,它要把数据反馈到现实应用当中,而不是光拿一些数据,没有用的。

3.3行业市场

再讲讲市场吧,这个大家都比较关注。为什么呢?因为数据1.0时代有泡沫,而且泡沫不小。可能2014年7、8月份之前,国内投大数据的投资机构并不多,可能也不会像今天有这么多人,还是比较少的。为什么呢?那时候整个行业、整个市场就那样。直至2015年诞生了一件比较好的事情——新三板。新三板要有标的物,那这个时候数据企业又是一个未来想象空间很大的,资本需要题材,这样大量的资金在那个时间点瞬间注入了进来,所以对整个行业的企业来说,急速的推波助澜。那这个泡沫是什么时候破的呢?2016年。6月1日《网络安全法》,就是个人公民隐私身份这个事。这个《网络安全法》严格到什么程度呢?以前我们手机号码是不算你的隐私的,那个时候也界定了。《网络安全法》的公布有它的必要,因为在《网络安全法》之前确实市面上的黑产的数据比较多,也比较猖狂。当然通过这个法律也有一些企业陆陆续续地踩到雷了,当然也很正常。但是可能也不像媒体所报道的那样,因为这个行业很新,在它发展过程当中,我们可能作为投资人来看,还是要抱一个客观的心态来看。有些所谓的信息大家都要经过筛选,真正的如果说一些企业能够达到某种高度,这种是不太可能的。只能这么去解释这个问题。整个行业急速下滑,为什么呢?包括政府也不知道我该不该花钱买。2017年12月9日习主席开了常委会,明确定出了大数据这个事还是值得搞的,怎么搞,我们不能只谈数据交易、数据资产流通这些,要把这些数据应用到智慧当中、应用当中。

我在这个过程中总结了三个因素:1、政府是数据最大拥有者;2、政府也是数据库最大购买者。这个是毫不避讳的,因为他有数据,他不知道怎么用。他现在通过服务的方式,由这些企业给他。当然刚才有朋友在提问,是不是应收账款会比较长?但你放心,政府不会赖你账,这是很正常的,可能只是资金的周转问题;3、资本加速产业泡沫的产生灭亡。整个过程中,咱们在座的这些资本有时候也没干好事,这也是很正常的事情,因为没有泡沫你就赚不到钱,有了泡沫大家才能够赚到这些钱,这是很现实的问题。

3.4投资逻辑

接下来我们谈谈大数据产业的投资逻辑。


你投数据,首先是要有数据资源。我们在数据资源层面,从数据的获取、整理、流通、清洗四个环节布了一些企业,围绕整个数据源这个头上做了一些文章,还有交易平台的。有了这些数据以后,要有数据库吧,国产有四大数据库是吧。新的所谓的分布式数据库也不是全部通吃的,新的数据库在不断的迭代,这个肯定有一定的机会。第二个就是数据的检索、数据调用,包括数据工具,这里面都有些机会的,这里面我们也投了不少。包括虚拟技术,你也要去做投资吧,做投资你不能只投一个点,你得围绕着数据逻辑,构建自己的数据生态。有了这些数据以后,解决了它的放的问题,数据我要变现吧,不能空守着一堆矿在那,我不挖也成不了“富二代”,我要把它挖了我才能成“富二代”。好,哪个行业可以去投?比如数据运营、数据支撑、数据应用、行业应用,那我们有幸在13个领域,包括公安、部队、交通、金融、旅游、智慧城市等13个行业都投了一些还算不错的标的物,所以这里面是我们重点布局的产业。那么数据有了以后,因为数据是不可见的,一堆干巴巴的数字怎么让人看得到呢,那让数据可视是一个大的问题。这个事做起来容易,做好了难。做起来容易什么呢,Excel的方式,大家可以把数据很容易展示出来,但是真正把它做好了就很难,因为每个人的设想都不一样,有可能行业内需要大量的定制。到目前为止来看,还处在发展的阶段。但如果我们把人工智能加进来,可以想像的空间是很大的。人工智能如果把它输入进来,根据个性进行调整,是可弹性的展示,那就很厉害,这时候对你技术方面的要求会非常高。

3.5估值体系

轻资产、重人力投资是大数据企业的显著特点。投资过程中,几乎所有的企业老板都会对我们讲,说我这个是大数据,是最牛的产业,我有最靠谱的团队、领先的技术和稀缺的资源。意思就是,你得给我高估值。那我们怎么来看呢?如果按照PE/PB/DCF通用财务模型来估的话,没办法估。为什么呢?它没收入,或者收入很少。利润的话,过去基本都很少,可能1000万的利润,在市场就会要到6-7亿,还可能更高。但是你怎么办呢?你是不是不投?那这个时候问题就来了,这企业的本质是什么呢?一堆人、一堆电脑,啥都没有。怎么办呢?我觉得可以从三点来看:

一、退出市场的场景。你投大数据企业的时候,有可能有些高估值溢价的时候,你想想看,我的接盘侠是谁?传导效应,VC后面的PE,然后谁接呢?它不上市谁接呢,没人接,那就完了,我就进去了。所以这个逻辑要想好。

二、产品应用的场景。你就问这个企业,你这个产品到底解决什么场景、解决什么样的实际问题?我思考一个问题,我这个场景能不能复制,如果能复制,那我可以给它比较高的一个溢价;如果不能复制,那么我给的价格肯定是要打个折的。

三、要考虑一下基金的整体布局。到底我是要抢占这个制高点,还是说我就是个打酱油的。如果我是想抢占制高点,有可能这个项目在行业里已经到了B轮、C轮的时候,我必须要投它,那这时候对价格的敏感度就稍微弱一点。假如我已经布了,虽然是我想投它,但这个价格我承受不了,这时候就要考虑你基金组合的问题。

怎么去估值呢?我们投的这30多家,很大一部分都是撮合。说起来很玄乎,撮合什么呢?你要10块,那8块行不行?不行。8块5?不行,要9块;差5毛,你看我有这资源、有那资源,大家慢慢的撮合下来。这是第一个。那第二个,就是参考标的。这个类型的企业,比如这个企业18个人、30个人,他当时收入只有500万,还倒挂了三四百万。怎么办呢?一开始我投它1亿,那类似的企业后面来了,这可能也就1亿、1.5亿之间。你不可能说你就比别人优秀。其实人都差不多,你说你出身于IBM,Oracle,没问题,我认,但是我要看整个产业,因为现在是数据2.0时代,1.0时代的时候有泡沫,我进去了。那2.0时代要有产品的应用,所以有参考的标的。

还要看它的产品成熟度,投资方的出发点,有些创业团队的产品还是个Demo,什么都没有,那时候你能给它高估值吗?所以对于轻资产、重人力资源的大数据企业,在估值层面套用市面上成熟的商业模式,基本上在早期阶段是不存在的。到了中后期以后怎么办呢,那估值里面最大的问题,就是大家都参考PB。现在证监会发了其他类企业上市标准,就是对收入有要求、对利润没要求,那么很多做PE的就是参考你的收入×PBS,这种方式来给企业定价。这样会挤压它的空间,当然可以适当的,因为PB的倍数可以变,10-15倍,再加上销售收入规模也可以变的。企业提供的是销售收入,机构给的是倍数PB,10倍、15倍,所以双方有浮动的空间在里面,这里面就是双方博弈的价差。如果早期的话,坦白说,就是握手交易,我认可你,看你长得漂亮,那我就给你投钱,那1亿、1.5亿是没有差异的。

时间关系,今天我就给大家分享这么多。谢谢!


联系方式

管理总部:南京市西城路300号君泰国际A幢15-23层

服务电话:400-025-4677

传真号码:025--52344677 

资料接收邮箱:vcinchina@foxmail.com 


咨询热线:

025-52384677