注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

财经天下周刊

有趣有用的财经新闻

 
 
 

日志

 
 
关于我

《财经天下》杂志官方博客

一本有趣有用的财经杂志。《财经天下》周刊致力于成为中国读者量最大的财经商业杂志。我们试图让大众享有与朋友、家人分享财经新闻的权利。读者至上是我们永不妥协的底线,有趣有用是我们的最大特质。我们以轻松写作和时尚视觉来解释你的每个好奇,给出“下一步”的指引。不端,不装,不俗。 现在就登陆淘宝,购买《财经天下》周刊!淘宝旗舰店“博雅天下书店”:boyatianxia.taobao.com

文章分类
网易考拉推荐

【特写】大数据,你的私人定制  

2014-01-02 20:35:52|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
       本文刊登于20131230日出版的《财经天下》周刊第26
【特写】大数据,你的私人定制 - 财经天下 - 财经天下周刊

   视频网站正从“猜你喜欢”向“我知道你喜欢”进化

  本刊记者 方婷

   
关于大数据,有个人性化的说法——大数据就像青少年之间的性,每个人都以为别人正在进行中,所以每个人都把它列在自己的计划上;每个人都在口耳相传,没几个人真的见过——对互联网公司而言,大数据是个时时被提起的宏大战略,但真正靠谱的产品很少见;而对普通用户来说,大数据更像是个耳熟能详的抽象概念。
   
如今,普通用户也有了可以利用大数据的入口。正如互联网上的许多项技术变革是由大众的娱乐需求推动的,这项关于大数据的产品首先产生于视频网站。2013年年底,视频网站爱奇艺在综艺节目的进度条下,添加了两个不起眼的小字:绿镜。点击它之后,你所看的将是剪辑过的节目片段合集。举个例子,当下最热门的综艺节目《爸爸去哪儿》一期的总共时长是90分钟,开启绿镜模式之后,你所看到的是29分钟的精华版。
   
负责剪辑节目的不是网站的视频编辑,而是后台系统,或者说所有观看视频的普通用户。大多数人在观看视频时,都会根据自己的兴趣暂停、快进、倒退。对于爱奇艺首席技术官汤兴来说,这就是用户在无意识地通过这些动作来评价内容的好坏,“用鼠标来反映哪些是他们认为好看的,哪些是无聊的。”
   
简单的说,绿镜就是将所有用户“评价”汇总,再经过后台系统的运算,将最受欢迎的片段剪辑出来,形成精华版视频。
 
这不是视频网站第一次应用大数据,事实上,视频网站的首页推荐,播放页边栏上的“猜你喜欢”,都是以用户行为分析为依据。绿镜在算法上,甚至比前者更为简单,但这款产品却是更实用的大数据产品,因为之前的产品精准度还不足以让大多数用户注意到它们,而绿镜在没有经过宣传的情况下,第一天就有20万用户点击。
   
相信很快就会有类似绿镜的产品出现,这种产品不仅仅能够为普通用户节省时间,更重要的是让电视台等内容制造方准确了解哪些明星、桥段才是观众喜闻乐见。
   
用户定制的时代来了。
   
灵感来自吐槽老板

这个产品最初的起源,只是几个工程师的玩笑。2013年2月份,爱奇艺CEO龚宇以嘉宾的身份登上湖南卫视的访谈节目《天天向上》,与他同期上节目的嘉宾还有电视剧《笑傲江湖》的主演霍建华与陈乔恩,这期节目隔天就在爱奇艺上线。
   
几个爱奇艺的工程师,本着对领导的原始好奇心,偷偷在网站后台用算法总结出这期节目的用户行为数据。结果印证了他们的猜想,在龚宇出场的时间里,收视曲线降到谷底,“惨不忍睹”,等到陈乔恩和霍建华出场后,曲线陡然升上高峰。与看电视时的被动接收不同,当节目的进度条可以随意调节的时候,嘉宾究竟受不受欢迎这件事儿就变得更加直观残酷。
   
这次吐槽式的观察成为绿镜开发的灵感和起点。花了两个多月时间,爱奇艺的工程师研发出一套算法:当节目在网站上线并累积了足够多的观看次数之后,后台会记录下所有用户的操作行为,并生成绿镜版。
   
实际上,这个产品并不是由一个部门完成的,而是爱奇艺内部不同部分协作完成。具体的说,以《爸爸去哪儿》为例,一个绿镜版的产生,先需要收集数据,在达到一定数量后,进行清洗,然后根据清洗后的数据建立模型,完成视频编辑。
   
所谓清洗,就是去年汤兴所说的“噪音”数据,这些数据并不是真实的用户行为,举例来说,如果一个用户在某一点上暂停几秒钟,他可能是在截屏,如果是几分钟那上厕所的可能性更大。
   
在建模时,要为不同行为赋予不同的权重,包括快进快退、暂停、分享、评论以及截图等不同行为,按重要度来为不同的片段打分。之后的计算过程非常简单,一个30分钟片长的视频,只需要十几毫秒的时间就能完成。
   
在互联网世界里,收集用户数据比传统电视行业要容易得多。用户的所有交互行为都会在互联网上留下痕迹,存储在各家公司庞大的数据库里。生成绿镜版本的前提是节目有10万以上的播放量,这个数字不难达到。在视频网站上,一线综艺节目整体播放量的单位通常是亿,像《爸爸去哪儿》这种有热度的节目,上线一个小时之后,就能够生成绿镜版本。
   
“每隔二十分钟,系统还会重新更新一次。”爱奇艺产品经理赵超越介绍道。当初那群好奇地研究龚宇是否受观众欢迎的工程师中,戴着黑框眼镜的赵超越是其中之一。她是90后,算是看着综艺节目、玩着互联网长大的一代人。对他们来说,光是看节目是不够的,他们更想参与其中。
和其他大数据产品一样,绿镜还不够成熟。用绿镜看节目无可回避的一个问题是画面不够连贯。大数据剪刀手只能挑出那些受欢迎的片段,它们分散在节目的各个桥段里,生成绿镜版的时候并不能保证衔接流畅。这也是绿镜为什么暂时只在综艺节目上运用的原因。综艺节目对剧情连贯性没有很高的要求。观众主要看的是自己中意的表演嘉宾,哪怕画面突然被切断也没有很大的关系。在电视剧、电影上,很难想象被切割后的情节还能够同样被观众欢迎并接受。
    
在目前这个版本中,爱奇艺用最简单粗暴的办法来解决连贯性的问题,就是干脆不去考虑如何保持剧情连贯,而是在每个片段中间暂停一下,闪现“绿镜”标志,然后直接转到下一个片段。
   
绿镜的版本仍然在优化。在内容的连贯度没那么容易解决的情况下,研发团队将重心放在满足每个用户对时间的需求上。在大数据的世界里,每个人都是构成庞大数据分析的小小分母,每个人也都是有权享有个性化服务的VIP。
   
“下一个版本可能会让用户主动规定想看多长时间,比如说你早上起来刷牙的时候,你就想快速浏览要闻,你就可以选一下10分钟,每次10分钟最精彩的东西让你看完。包括我们经常看90分钟的球赛,其实真正最精彩的就是10分钟,就是射门,或者是被射门,或者是带球过人的动作。”汤兴说,新闻和体育节目,将是绿镜的下一块试验田。

另一种参照标准
   
目前爱奇艺有一个十几个人组成的团队负责优化、维护绿镜系统。实际上,对于爱奇艺或说其母公司百度来说,绿镜还可以形成另一个产品,就是更精准的收视数据,这是每一个制片人求之不得的。
   
北京郊区某个影棚,一楼正在热闹地录制节目,二楼的简陋化妆间里,借着灯光,王凡仔细地翻着一叠A4纸,上面印着的是收视率波状图。他所制作的《大王小王》是一档情感访谈类节目,每周一到周五在湖北卫视播出。录节目之前,研究上一期节目的收视率是他必做的功课。
   
数据来自第三方咨询机构,对于王凡来说,这是总结往期节目的结案陈词,也是指引下一期方向的启示书。长久以来,收视率是衡量电视剧和综艺节目的唯一标尺,但统计方式一直不能让业内满意。
   
收视率采用取样调查方式:在一个城市里,根据当地居民的性别比例、年龄分布以及职业和收入情况等,选取一定数量样本户,通过对样本户收看内容的监测,来推算整个地区的收视情况。据一位业内人士透露,实际上样本记的数量相当有限,在人口过千万的城市里,样本户的数量一般不超过500户。由于取样的数量太少,一旦有样本户受到贿赂,将收看频道固定在某个电视台上,即使只有几家样本户,就能影响到一个地区的收视率。迄今为止,并没有哪个实际的样本户受污染的案例被爆出来,但电视台之间的互相指责,却从来没有停止过。
   
对于百度这样的互联网巨头,这正是新的市场机会。据汤兴透露,绿镜数据目前还没有单独出售,仅作为增值服务提供给合作方。例如,爱奇艺在购买《爸爸去哪儿》、《快乐大本营》等网络版权节目的同时,已经将绿镜数据分析结果做为附赠品送给电视台。也就是说,如果下一季的《爸爸去哪儿》中,有哪对父子没有出现,这很可能是绿镜的功劳。
   
在汤兴看来,和之前的收视率数据相比,绿镜数据的最大优势是取样量非常大,热门视频的点击量可以达到上千万甚至上亿。汤兴相信,随着精准度的不断提高,视频网站的数据将影响到上游的影视内容制作。
   
实际上,爱奇艺之外的其他视频网站也都在做类似的工作,这些网站在购剧后都会向制作方提供节目的整体播放量、网友的评论反馈、网友在某一节目类型里的偏好关联,并以此为筹码,说服制作方对节目进行调整。
   
转变不可能很快发生。在传统制作和大数据运用之间,隔着不止一道鸿沟。像王凡这样的传统制片人,在观念上更习惯央视索福瑞的数据,视频网站提供的数据对他来说权威性还不够。

终点还没到

但技术的车轮不会停止转动。视频网站们还在继续细化收视数据,“现在只是提供收视结果,下一步,我们会划分用户群体,维度包括观众的性别,年龄,所在地域等等。”汤兴将之称为用户脸谱。
   
“不同年龄段、性别的用户,喜欢看的题材、片段都是不一样的,当然地域差异也很大,南方观众可能不喜欢郭德纲、二人转,北方观众可能不如上海人那么喜欢周立波。”汤兴说。
   
很快,无论是对观众还是内容制作方,绿镜版都将更加个性化。对于电视台和视频网站来说,脸谱划分则可以提供更精准的数据,作为广告投放依据,这一个理由实际上已经足够了。  
   
对于用户来说,当脸谱划分完成后,不仅不同地区、性别的观众看到的是不同的推荐内容,甚至同一个用户,其PC端和手机端的推荐也不一样。从这个角度来看,绿镜只是视频网站内容个性化过程中的一个偶然出现的新产品,而不是终点。
   
“爱奇艺的发展趋势之一,就是根据用户的喜好做个性化推荐。”汤兴说,以前传统的门户,都是编辑来决定你看到的是什么,“全中国的人看到的都是一模一样的页面,不管你喜欢不喜欢。”
    
与门户相似,在绿镜出现之前,视频网站引导用户收看节目的是后台编辑的个人喜好。每次节目上线之前,编辑都会提前看过一遍甚至几遍节目,挑出一些剧情节点,起好耸动吸引人的标题,标注在进度条上。大约从两年多前,优酷、搜狐、爱奇艺等多家视频网站就已经上线了这个功能。
   
此后,大多数视频网站都增加了“猜你喜欢”功能,运用的就是大数据原理。只不过,绿镜运用大数据的维度是每一个用户在播放节目时每一分每一秒的动作,而“猜你喜欢”参照的维度是用户一段时间内的动作:看完这段视频之后,用户接下去会搜索点击到哪个视频?在数据上关联度越高的视频,就越容易被列到推荐列表上。
   
视频推荐功能的开发和优化比绿镜难度要高得多,以至于各网站都还在不断优化推荐功能,用户甚至无法察觉到这种变化。

但对视频网站来说,这种数据优化意义重大。“大数据的算法每进步一点,点击率就会上升一点,每一个算法工程师可能只是将推荐的成功率提高零点几个点,对公司整体的流量的贡献可能就是几百万、几千万。”汤兴说。
   
   

   
  评论这张
 
阅读(432)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017