Netflix成为全球主要媒体流服务的崛起绝非偶然。它基于复杂的数据处理和情感配方,这意味着该公司甚至在您了解自己之前就知道您想要观看的内容。
According to Netflix’s latest quarterly figures, the media streaming service is racking up almost 2 million new subscribers every month.
这种持续增长的原因(无论您相信的是好是坏) )要比拥有便捷且价格合理的服务库更深入。
正是Netflix的算法,大数据和直觉的秘诀助长了这一不可阻挡的增长。正是这种秘密手段使Netflix不仅能够始终如一地推荐用户会喜欢的内容,而且还能为该内容的创作提供资金,并确信它会 >将成功。
数量惊人的大数据
大数据在Netflix推荐和资助正确内容的能力中发挥了重要作用也就不足为奇了。然而,令人惊讶的是,每次使用该服务时Netflix跟踪的数据类型和数据量。
根据Netflix官方博客:
当成员开始观看电影或电视剧集时,就会在我们的数据系统中创建一个“视图",并收集描述该视图的事件集合。"
在此过程中,Netflix会跟踪您的“只要订阅[you],就可以查看整个历史记录"。该系统“在每个视图中收集定期信号,以确定成员是否还在观看"。它还可以跟踪您的搜索,收视率,地理位置数据,设备信息,浏览行为,正在观看的一天/一周中的时间,何时决定放弃演出,暂停和快进。
成千上万的Netflix用户每月流失数十亿小时的内容,该公司收集的数据量令人困惑。数据对于公司的成功至关重要。
2014年,GigaOM解释了Netflix的高级数据科学家Mohammad Sabah的话:
“ 75%的用户选择电影是基于公司的建议,而Netflix希望使这个数字更高。"
此查看器数据非常庞大,因此为什么该服务如此令人上瘾非常重要。结合每个节目存储的大量数据,很难不同意大卫·卡尔的理论,即“ Netflix委托原创内容是因为它知道人们在做什么之前想要什么" (强调我自己) 。
不断改进的算法
单独使用数据几乎没有用。正如杰森·吉尔伯特(Jason Gilbert)所写; “ [Netflix的成功取决于它能够选择观众喜欢的节目,同时仍能盈利"。
为此,Netflix使用了算法。正如工程总监Xavier Amatriain告诉《连线》:
“ [公司已经开发了]几种算法,每种算法针对不同的目的进行了优化。从广义上讲,我们的大多数算法都基于这样的假设:相似的观看模式代表相似的用户品味。我们可以使用相似用户的行为来推断您的偏好。"
与观看模式相比,这种关注方式远比直接查看您对节目的评级更可靠。
当将有关用户和的数据输入这些机器学习算法时,观看者的行为可以与具有某些相似性的节目相匹配-生产年份,演员,导演等从每天在Netflix上流媒体播放的小时数可以看出,这些算法显然是有效的。
该公司一直在运行大量的A / B测试(允许将用户体验和算法更改推出并在较小的用户子集上进行测试),迭代地改进每个算法。根据Amatriain的说法,这些测试“让我们同时尝试激进的想法或测试许多方法"。主要目标几乎总是要改善“成员的参与度(例如游戏时间)和保留率"。
直觉
在另一个Netflix Tech Blog帖子中,Xavier Amatriain指出:
“大量的源数据,测量结果和相关实验使我们能够运营数据驱动的组织。
仅根据数据制作和推荐节目的想法有点令人不安。
但是电视行业一直非常依赖数据(通常以焦点小组和观众人数的形式)。但是,Netflix正在采取进一步的措施。
话虽如此,该公司全球企业传播总监Joris Evers希望减轻用户的注意。他告诉《纽约时报》:
“我们不会在创意方面投入过多……我们会雇用合适的人,并给予自由和预算以做好工作。这意味着当塞斯·罗根和克里斯汀·维格被宣布为即将到来的被捕开发的一集的特邀嘉宾时,并不是因为统计分析告诉Netflix这样做了。"
换句话说,大数据和算法的价值决定了Netflix的决策,而不是决定了它们。电影的资金和节目的创意将快速增长。那些感觉良好的人将受到数据的影响。如果看起来好像有足够多的Netflix用户感兴趣,并且决策者的直觉认为该节目将大受欢迎,那么它就会受到赞许和大笔支票。
食谱似乎起作用
这种数据混合,不断改进的算法以及直觉似乎对Netflix有用。实际上,如此之多,该公司就有信心在发行试播集之前资助整个系列节目。多数其他广播公司的工作方式却相反。
制作人和导演可以将创意转变为Netflix。如果大数据和直觉相加,并建议可以通过增加新订户和增加保留率来弥补成本,那么Netflix就可以全力以赴。 《纸牌屋》就是一个例子,该公司在两个季节内投资了1亿美元,甚至没有看到试播集。这就是为什么2016年Netflix将在几年内比其他大多数广播公司生产更多原始内容的原因。
如果Netflix无法在理解和预测您(或至少大多数人)喜欢观看。在您甚至还不认识自己之前。
对您的影响:您发现Netflix的推荐适合您的口味吗?如果没有,请尝试使用这些秘密的Netflix搜索代码。
图片信用:Andrey_Popov撰写的对年轻夫妇来自Shutterstock,Server Room属于Torkild Retvedt( Flickr)