【中国智能制造网 名家论谈】回到国内以后有幸参与了一些数据产品的想法的产生,开发,包括上线以后的效果的评估。所以我今天就从一个数据科学家的角度,跟大家讲一讲,在现在人工智能、大数据风口浪尖上,一个产品人应该注意的几点,希望对大家有所帮助。
李丹枫:人口红利渐失 数据方是互联网突围之道
人口红利消失之后,该如何留住用户?
,我们肯定要看一下大趋势,今年大家听到比较多的词,是人口红利逐渐消失,下面这个图估计大家看了很多,但是我还是要强调一下,我们可以看到中国互联网的用户在 2007 年,大概只有两亿左右。十年以后到 2016 年以后,我们已经迅速增长到 7 亿多,但是我们看这个红线,增长率基本上是直线下降的。
也就是说我们以后再用野蛮的方式获取客户的方式,可能就会遇到很大的瓶颈即便是对一些非常新兴的领域,其实竞争也是非常激烈的,现在比如说网络直播、共享单车,这些都是非常新兴的领域,大家也看到了许多的大公司,创业者、投资人也迅速加入战场,把我们本来一个蓝海,迅速的变成一个红海。
所以在这种情况下,我们作为一个产品人,我们必须考虑我这个产品怎么样才能够留住我的用户,怎样才能让我的用户发挥大的价值。
一个产品人,我需要仔细看我这个产品的数据,我去判断什么样的用户是我的核心用户。对于这些核心用户,我们从哪才能获得这些核心用户,第二这些核心用户怎样才能把他服务得更好。
这些如果你只是看一些数据拍着脑袋想肯定是不行的,我们必须要借助一些数据分析,比如说我要看我的用户的用户画像是什么样的,我的核心用户和我非核心用户的画像有什么不同,我的核心用户他们经常都会在哪些地方出现,这些核心用户主要应用的是什么功能,这些都是一个产品人需要从一个数据科学家的角度来仔细的研究这个产品,这就是说,我们在下半场的时候要精耕细作,而不是野蛮生长。
其实在今年因为友盟+本身有很大的的客户群体,我们今年也开始接触一些企业,包括一些大的传统企业,他们走进互联网,我们在接触这些企业的过程中,发现企业本身对数据的认识也有了一些变化,其实这个变化不是中国独有的,我记得当时在 2008 年在美国的时候,当时 Hadoop 刚刚起来,我们去跟很多企业谈,企业说我要上大数据,作用的大数据是什么,你给我建一个 Hadoop cluster?,我把数据都扔上去,我所有的数据。我要看什么指标,都可以去 Hadoop 里面把它找出来,先来看,至于说他们想什么,他们也不清楚。
中国的企业现在也在经历这样的过程,我跟一些企业谈,他们其实已经慢慢的把数据堆积在 Hadoop cluster?里到渐渐的我要从数据里面得到一些什么,这个数据我花这么多钱搭一个 Hadoop cluster?,我有什么办法让我花的钱物有所值。
步,数据收集。现在数据收集已经从原来的简单的数据收集,变成了比较精细的数据收集,拿网站统计和移动统计来说,原来的网站统计基本上是基于 PV 和 UV 的,什么人来了这个界面,这个界面被看了多少次,这个文章被点了多少次,移动统计的是说,我有多少用户,我每天多少日活,每月多少月活这些简单的数据。
现在的统计产品,渐渐从这些简单的统计走到基于事件的统计,对你产品里面每个细节都可以做到精细的统计,比如说做漏斗分析、留存,这样的话能够给运营很的指导。
所以从数据收集已经走到了统计报表的步骤。
第二步,人工智能。人工智能应用到产品当中,我们可以把它叫做预测分析、预测服务,预测服务和统计报表大的不同,从我个人的观点,一是说统计报表基本上是往后看、往历史看,历史上发生了什么,我通过统计报表,我有一个很好的总结,我可以通过历史的现象总结出几条规律,这个规律指导我以后的运营工作。
预测服务是往未来看,我根据过去的这些数据,我用我自己的知识再加上机器学习的能力,我让机器帮助我判断未来能够发生什么,其实这个事情,我们在日常中已经接触的很多了,比如说现在大家看到的广告,广告很多都是程序化购买,程序化购买实际是机器去判断什么人会对这个广告感兴趣,包括今年双十一阿里的天猫手淘,实际上每个人看见的页面都是不一样的,我们叫千人千面,千人千面就是一个推荐的产品,就是让机器帮助我们做预测,什么人会对什么样的商品有兴趣。
还有一点不同,统计报表和预测服务,统计报表是面上的东西,我只能从一个统计级别大面上看,预测服务很多时候是个体级别的,我可以到一个个体,我为这个个体提供他所需要的服务,这个在现在我所谓的互联网下半场变得极为重要,因为我们现在的需求,每个人都会有不同的需求,如果我感到你这个产品真的给我做了一个贴心的服务,我可能会变成你这个产品的忠实的用户,为什么说下半场数据和数据产品变得越来越重要了。
两张重要 PPT?
我今天的演讲 PPT 不多,如果大家要带回去两张,我觉得下面两张是比较重要的。
张,我会说一下作为一个产品人在做数据产品的时候需要注意的几个问题。
,目标。我要解决什么样的问题,为什么我要把这个提出来,因为在大数据和人工智能的场景下,很多时候你的客户是不知道他们要什么的,其实你可能也不是很清楚,这就需要大家在一起去想,我有这个能力,我有这个数据,我能够提供什么样的服务,这是过去我做用户需求调研是完全不同的,但是我觉得这点,对于数据创新和大数据、人工智能走到下一步是非常有用的,需要我们数据科学家、产品人,每个人发挥自己的想象力,我们能够推出真正能够解决客户的问题,这些问题可能现在客户都不知道,所以说步我们要想清楚我们要解决什么问题。
第二,我们有什么数据或者说你能获得什么数据。这实际到我下面的小字,为什么是我做,因为有时候说这个数据源不错,我可以用这个数据源来做一个产品,但是如果你这个数据源不被你控制,人家说拿走就拿走,你这个产品你做完了以后,人家把数据源抽走了,你这个产品就没法往下走了。
所以我们一定要考虑,我们有什么样的数据,我们用我们自有的数据,这些自有的数据有什么独特性,我们通过这个独特性推出一个新的产品,或者说我们有一些什么样特殊的能力,这些特殊的能力能够把我们和其他人区分开来,我们通过这个能力跟数据方合作推出新的产品,所以对数据的考虑非常重要。
第三,我做出一个数据产品,尤其是预测型的数据产品,我怎么去评估。即便对数据科学家来说,实际上我们会面试很多数据科学家,我有时候问他们问题,他们其实也是回答不出来的,因为对于一个产品的评估,它有很多方面,对一个数据模型,什么样的模型是好,什么样的模型是坏,它有很多方面。
我下面会举两个例子,我们今年的两个例子,会对评估做进一步的阐述。当然我下一个 PPT,也会对评估做进一步的阐述,因为我觉得这个评估是对一个预测性产品成功非常重要的一点。