原标题:GAITC专题论坛丨每日互动方毅:“6R模型”,开启智慧化运营之路
7月26日,由中国人工智能学会主办、新浪新闻联合浙江大学承办的2020全球人工智能技术大会(2020GAITC)“AI时代下的新媒体与社交娱乐”专题论坛拉开帷幕,新浪集团首席信息官、新浪AI媒体研究院院长王巍,浙江大学特聘教授、悉尼科技大学教授、百度研究院访问教授杨易共同担任论坛主席。
每日互动创始人、CEO方毅在本次专题论坛上,与来自业界、学术界的嘉宾们分享了《AI时代下的精细化数据运营》。
图注:每日互动创始人、CEO方毅作主题演讲方毅认为,数据资源不等于数据智能。如果把数据看作智能时代的“原油”,数据智能所做的就是“炼油厂炼造”。在这个“炼造”的全过程中,需要挖掘数据,端详数据,提炼激发数据价值,打造数据智能解决方案,以及反馈归因,以此为闭环不停循环。
他将数据智能深度理解之后提炼为最核心的三个单词:D(Data)、M(Machine)、P(People)。
以下为方毅演讲实录,内容经编辑略有删减:
感谢邀请,前段时候我们公司在西溪湿地开了一场论坛,包括王巍总在内给我们带来了精彩的演讲。今天我们聚焦几个点,大数据如何服务和助力媒体运营。
杭州健康码的赋码引擎是我们做的,这个赋码引擎当中充分地应用了数据智能。另外,我们支撑了五个部委203个有疫情的地市,取得了非常好的成绩,获得了广泛的认可。
我们自己是做SDK,手机推送的模块,大家常用的包括新浪微博在内,人民网,新华社、央视各种各样的APP里面都有我们的服务,包括中国很多电视机里面用的SDK以及很多车辆系统用的SDK,随之形成了庞大的数据。去年年底的时候,我们SDK的安装量就已经超过520亿,现在日活在4个多亿。基于这些体量我们既形成了大数据,又非常的规范,APP里面的内容行为我们一概不碰。
第二个是场景数据。刚才金教授讲到了萃取,实际上是非常重要的,我们从这么多的数据当中提炼和萃取,就形成了冷、热、温三种数据的类型。
给大家举个例子,最简单的是,比如我们给惠氏奶粉找出母婴人群。对广告来讲,如果是精准的,对你来讲有需要的,就是信息。如果给你垃圾消息,就会大量的占用你的时间。所以我们首先会找出60多个母婴类典型的APP,把这60多个APP扔到大数据池子里面去找TGI,去寻找装着60个APP的人还装着什么应用,会发现绝大部分是你能理解,还有一些是原来想不到的。用这2000、3000个APP再去滚动标注,找出6000万母婴相关的人群。
这是另一张图,中间这些不睡觉的我们找出来,跟世界杯、欧洲杯球赛的时间去对一对,加上他的行为模式,中国3000多万的真球迷全部找出来,这些人如果你要给它一些运动产品的推荐,非常的精准和投其所好。
其实我们用大数据在很多的领域,绝招就是这么五步:第一步,其实刚才老师讲到了标注,非常重要;寻找w值,从w值当中用大数据给它画像之后端详数据,非常重要的就是相似性扩量,扩量完了之后一定用于实战,并且形成闭环归因,基本上我们就不停地循环。
这里面有大量的信息的过程,包括运营。中国目前统计的有500万左右的APP,应用商店里面大概有30万左右。而我们通过大数据发现中国人安装过的有3000多万个APP,怎么样从这些数据当中提取信息,我们做了大量的工作,把APP和APP之间向量化,找出其中的关系。
我们可以把APP聚类,同时去做人群画像。所以在大数据当中,其实我们用了五种:挖,大块的挖掘;红豆绿豆混在一起要挑,捡贝壳、和田玉,淘金沙,最后萃,如果是液体和稀土就用萃取的方式去解决。
我们最近还在做一篇论文,其实SIR模型之外,我们还提出SITR模型。这个写在我们的招股书上,也是我们作为数据智能深度理解之后最核心的三个单词:D(Data)、M(Machine)、P(People)。
底层来讲,数据的沉淀必须是动态的;驱动业务,有深度的;中间实际上是机器,机器当中除了感觉系统之外,非常重要的是对于专业领域的理解,或者Y值的获取,形成输出,所以我们公司的打造就是围绕三层结构去做数据智能。
我们和新浪有很多合作,新浪是我们重要的股东。我们“个信”被干掉之后,当时转型做个推的时候,新浪就成了我们第一个重要合作伙伴。我们与新浪微博实现了实时新闻推送,世界上最早的奥运新闻推送就是我们当时跟新浪一起合作的,2012年的时候中国人每拿一块金牌,用户就会在秒级得到消息。现在来讲,重大新闻推送已经成了常态,包括这次唐山的地震,所有人甚至在地震波传来之前,接收到推送,这其中也有我们参与。
所以我们在早期的时候做了四代推送,实时推送到后面的应景推送,到智能推送,全景推送,比如说滴滴,我们帮它一起去做,用户走到经常打车的地方就会收到优惠券和提示,这个在市场早期竞争当中起到了非常大的作用。到后面的时候我们又提出了用户增长,包括用户洞察,精细化运营,流量变现过程中的全生命周期闭环的一个业务合作。
前段时间有同事在想精细化数据运营当中要用什么样的模型,有人说AARRR模型。后来我们迅速画出了我们原创的6R模型,用三个词来概括,就是“拉推”“回忆”“收留”。对APP运营来讲,非常重要的实际上是获客。APP发展好一个用户之后,非常关键的是要再生数,所以一个APP的用户通过他进行口碑传播,怎么样去再生,这样你的获客成本就会摊销掉。头条为什么能杀出来?非常重要的是,头条的新闻被转到朋友圈等社交网络,大家点进去之后安装。
第二个非常重要,大量的用户可能会卸载、流失或者沉默,这是一个非常普遍的情况。80%多的APP如果没有很好的推送,可能就会流失。所以大量的公司在做广告,重新把流失用户召回,或者把沉默用户激活。
中间产生非常重要。给用户留下很好的印象,让用户主动地回来,不用带动作就能召回,所以在广告领域是这样一个过程。
获得流量之后总要去变现,更高效率地定位人群更好地变现。同时,在变现的过程中,一定会对用户体验产生承压,怎么样让用户留下来,我总结了拉推、回忆、收留便于大家记住。
我们做了一个平台,logo是鲸鱼。我们推了一个叫“鲸智”的平台,对用户全生命周期的管理会是非常好的一种体验。在增长部分,我们可以用到端外潜客的挖掘,通过现有的用户去做精准的触达,包括效果回流的全闭环的分析;中间包括激活,激活非常重要的是要结合用户的场景,用户需要的时候做激活。最早的时候有一个负面的案例,有一个APP他们每天早上八点半给人推一条消息,一开始很受欢迎,但后来发现周末的时候会导致很多的卸载,后来发现那个时候大家在睡懒觉,所以周末就调到九点半。很多非常重要的信息,比如说10点半给你推周边菜馆的消息,这个时候就非常的舒服。
这个过程当中,变现过程也非常的重要。我们的大数据帮助这些流量方把它的用户分成各种各样的人群。对于宝洁,包括高露洁、耐克很多泛众的用户,要给不同的人群,用不同的创意和故事去打动他们,给70后的大老爷们和00后的小姑娘去推一样的创意,一定是错的。
我就分享这些,谢谢各位。
点击进入专题:
2020全球人工智能技术大会