1.2.1 用户数据产品
在三类数据产品中,用户数据产品是普通用户接触最多也是最容易的一类,因此,我们先从用户数据产品讲起,为大家展现数据产品的独特魅力。
根据数据来源,可将用户数据产品细分为指数型、统计型和生活型。这三类产品的区别见表1-1。
表1-1 三类用户数据产品的比较
下面针对三类用户数据产品进行具体介绍。
1.指数型
指数型数据产品一般由企业利用自己的数据提炼出相应观点和洞察趋势,提供给用户分析使用,如Google Trends、百度指数、微指数等。这些企业往往自身拥有非常庞大的用户数据,可以据此得出整个社会群体对某个领域的关注度。
我们以图1-1中的Google Trends为例来说明指数型用户数据产品的设计和使用过程。Google是全球知名的搜索引擎,每天有数亿人在使用它搜索各方面的信息,能产生数十亿次的搜索请求。为了更好地发掘这些用户搜索数据的价值,Google在2006年推出了Google Trends。它的数据来自大量没有过滤的真实搜索需求,具备匿名化、分类化和聚合化的特点,因此人们能够依此探寻从全球到城市的每个区域的热点情况。它采用从2004年直到用户搜索那一刻的数据,涵盖范围非常广。
图1-1 Google Trends产品截图
指数型数据产品的设计精髓是“比较”,通过比较各种关键词在不同区域和不同时间段内的出现频次,形成热度的高低演化。Google会先将某关键词搜索次数除以与之相关的地域和时间段内的总搜索次数,实现数据标准化,落在0~100的区间内。同时Google会过滤掉由少数人发起的搜索请求、重复搜索和一些特殊字符,以保证指数的呈现质量。可以看到,指数并非全面反映搜索情况的镜子,它更多是一个抽象的描述。这和我们常见的上证指数是类似的概念,上证指数并不能反映全部市场的表现情况,但能比较概括地说明当前市场的走势。
在百度指数里,用户甚至能看出某个搜索词的来源和去向,了解搜索用户的一些兴趣特征。通过这些工具,用户可以一窥行业走势,对市场调研、产品分析也有一定用处。甚至,Google在2009年曾经推出根据搜索词预测流感的案例,识别速度比当时美国的疾控中心更加快速,一时间被引为大数据浪潮的明星例子。虽然后来预测效果有所下降,但始终不失为一个优秀的参考,帮我们了解如何用这些身边触手可及的数据信息更好地认知这个复杂的世界。
2.统计型
统计型与指数型产品相比,最大的差别是数据均来自外部采集,然后经过企业内部整理呈现。这些产品往往可以供用户免费试用,同时有商用版本。目前国内外的统计型产品种类多样、方便易用,既有专注于企业融资信息及创始团队信息的,如企查查、IT桔子、美国的CrunchBase;也有重点分析互联网产品用户数据及下载数据的,如分析下载量和排名数据的七麦数据(原ASO100)、国外的SimilarWeb;还有提供政治、气候、经济等统计分析数据的,如Tradingeconomics网站,它展示了各个国家每年的通货膨胀率、GDP等宏观经济数据。
如图1-2所示的产品是SimilarWeb,它是一款浏览器插件,用户只需要在浏览网站时打开该插件,便能大概分析出该网站的访问量、跳出率、来源和去向网站等重要信息,非常强大。其基本原理是在用户安装该插件后,它便会自动分析用户浏览网站的路径和频次,然后通过一定的抽样放大算法,推测出该网站的流量情况。
统计型数据产品的关键是可靠的数据源和数据清洗。一般来讲,数据源都来自网络爬虫或者统计模块(SDK或插件)植入,前者存在一定的法律风险,且有数据容易脏乱的问题;后者获客难度较大,好处是能拿到比较优质的数据。
3.生活型
生活型数据产品是收集用户自身数据并进行一定程度的归类、分析与可视化的产品。数据对于公司来说,作用是通过统计分析来提升效率和节约成本;数据对于个人来说,则可帮助人们量化并提升自己的生活品质。这种产品可以大致分为记账类、运动类、天气类、时间管理类、信息记录类、机器信息类等。这些产品早期只是简单记录和统计,使用起来大多比较烦琐,而随着技术越来越成熟,此类产品慢慢地朝着智能化、便捷化和游戏化三个方向发展。下面介绍两个常见的产品。
图1-2 SimilarWeb产品截图
(1)网易有钱:智能归因记账
记账类的产品最令人头疼的地方是每次消费后的记录,打车、买早餐都得掏出手机记一下,不但烦琐,而且容易遗漏。网易有钱(见图1-3)利用智能匹配技术,只要用户绑定了信用卡/借记卡,每次支出都会根据他的支付对象自动归类到相应的类别,如餐饮、交通或购物等。用户最多只需要补录下现金支出的部分,而在如今这个无现金的社会里,操作次数完全可以忽略。
网易有钱现在支持的支付渠道越来越广泛,除了上面提到的信用卡和借记卡外,支付宝、校园卡、公交卡等也都支持,同时支持投资类产品的计算,完全做到了记账的傻瓜化。这其实很简单,但就是这简单的一步给用户带来了极大的便利。
图1-3 网易有钱官网截图
(2)Life Cycle:便捷版的柳比歇夫时间统计
“柳比歇夫时间管理法”是因苏联昆虫学家柳比歇夫56年如一日对个人时间进行定量管理而得名的。这种方法建立在数学统计的基础之上,重点是对消耗时间的记录进行分析,使人们能正确认识自己的时间利用状况,并养成管理自己时间的习惯。而图1-4展示的Life Cycle就是该方法的便捷版。
图1-4 Life Cycle官网截图
与网易有钱类似,Life Cycle也不需要用户做任何手动记录,其原理是根据用户的GPS定位来推测他的生活场景。比如用户夜晚在小区里待了很长时间,那大概可以推测他是在家。如果遇到一些无法识别的场景,用户只需要标记一次,后续便能正常记录。
这个App在数据智能上显然比网易有钱更进一步,毕竟对人们生活习惯的挖掘并不像识别支付机构那么容易。有趣的是,App下载后,必须等待7天的数据收集时间,这段时间打开App只有几个等待界面,到期后会自动提醒你。这个App的七日留存率想必不错。
4.小结
数据行业早期有BI(Business Intelligence,商业智能)的说法,专为商业服务。随着各项技术的成熟,数据产品在用户端应该有更好的应用前景和表现,做到普惠的DI(Data Intelligence,数据智能)。有时候一个简单的改进,就可以给用户带来极大的便利和价值。
当然,其中也隐含着诸多问题,比如数据安全和数据隐私。从上面的例子也可看出,只要简单知道用户的GPS定位,就能推断出他的生活习惯和职业内容等。数据是把“双刃剑”,如何做到便利性与用户隐私之间的平衡,是个非常艰深的命题,希望业内将来可以有比较完善的解决方案。