今日头条成功是算法失败也是算法

头条娱乐八卦_头条八卦娱乐官网_今日头条上娱乐八卦账号/

 

曹欢欢,今日头条首席算法架构师

今天我们打开今日头条,看到的就是满屏的新闻信息。 从内容上看,今日头条与其他新闻客户端非常相似; 从功能上看,今日头条特别像网络媒体。 但在今日头条CEO张一鸣眼中,今日头条是一款个性化推荐引擎产品。

百度是一个专注于信息搜索的大型引擎,而今日头条是一个专注于信息推荐的垂直引擎。 从这个角度来看,今日头条与百度非常相似。 过去,百度新闻也是依靠机器算法来过滤新闻,但后来被今日头条甩在了后面。

个性化推荐算法

今日头条由张一鸣于2012年3月创立,不到四年时间,轻松超越百度新闻等其他新闻客户端,成为互联网媒体的后起之秀。 今日头条的成功崛起,主要得益于其背后的个性化推荐算法。

在张一鸣看来,算法是今日头条的核心。

今日头条没有任何编辑人员,不生产任何内容,完全依靠机器算法来运作。 今日头条构建的算法模型会记录注册用户的每一次阅读行为,并据此计算用户的偏好,推送用户可能感兴趣的内容。

当用户使用微博、QQ等社交账号登录今日头条时,它还可以在5秒内通过算法解读用户的兴趣DNA。 每次用户操作后,用户模型都会在 10 秒内更新。 使用得越多,就越了解用户。 这使得准确的阅读内容推荐成为可能。

正是因为有了这个算法,今日头条在短短两年多的时间里就拥有了2.2亿用户,每天有超过2000万用户阅读今日头条感兴趣的文章。

基于用户投票和标签的个性化推荐

基于精心设计的机器学习引擎和大数据处理架构,今日头条可以实现针对特定用户的个性化推荐。 据官方描述,今日头条可以在0.1秒内计算推荐结果,在3秒内完成文章提取、挖掘、去重和分类,在5秒内计算新用户兴趣分布,在10秒内更新用户模型。

该算法听起来很强大,但基本原理很简单。 核心概念是投票。 每个用户有一票。 如果您喜欢一篇文章,请投票。 经过统计,最后的结果很可能是这群人中最好的文章,这篇文章就会被推荐。 对于同一组用户。 事实上,个性化推荐并不是机器向用户推荐,而是用户互相推荐。 看似简单,但实际上需要对海量用户行为数据进行挖掘和分析。

具体来说,今日头条会给每个用户贴上各种标签,比如科技、小米、足球、NBA等。当一篇文章包含标签关键词时,系统会自动推荐给带有这些标签的用户,实现所谓的个性化推荐。 个性化推荐实际上就是不断匹配标签的过程,但实现过程比较复杂。

您真正关心的内容不会成为头条新闻

虽然今日头条的个性化推荐算法实现了对大量用户的精准投放,但流量至上带来的低俗也受到了社会的质疑。

在今日头条网站,首页排名的内容很大一部分是娱乐八卦和社会负面新闻。 这类内容吸引读者,流量大,可以理解,但并不代表这种内容就是用户真正关心的。

人性中存在好奇、懒惰等自然特征,这为算法提供了利用的机会。 仅仅根据数据调查,某条信息的浏览量和转发量很高,然后粗暴地推荐给用户,或者根据用户过去的点击行为,猜测他们喜欢看被点击的低俗内容出于好奇,然后不断向用户推荐类似的内容。 该算法陷入了人性的陷阱。 更确切地说,该算法利用了人性的弱点,将用户限制在信息的茧中。

有时候,很多用户阅读娱乐八卦只是为了短暂的放松,这并不意味着用户真正关心的内容是娱乐八卦。 有时候点击一些低俗内容只是出于好奇。 单纯根据用户的点击来判断用户的兴趣,其实是非常片面和不合理的。 正是在这种算法下,越来越多的娱乐八卦甚至低俗内容充斥媒体,很多优质内容逐渐被边缘化。 这最终导致不良媒体驱逐良币、用户被低俗内容吞噬等后果。

《人民日报》也发表文章愤怒批评今日头条,称新闻不应该被算法“劫持”。

搭着所谓的算法“搭便车”,一些原本信息丰富的新闻客户端推荐的内容变得越来越单调,一些原本客观公正的内容生产者变得越来越极端,一些原本宏大的结构变得越来越极端。新闻媒体已经改变。 它变得越来越小。

算法不是万能的

任何算法都有其局限性,今日头条也不例外。 很多时候,你没有点击的内容可能是你真正感兴趣的内容,但在今日头条根本找不到这个内容。 没有选择,就只能点击娱乐八卦等内容。 因此,必须及时改进算法,适当推荐用户未点击的内容。

此外,算法推荐与人工干预相结合也是大势所趋。 最重要的新闻不一定是点击率最高的新闻。 时事、财经等严肃新闻需要强有力的人工干预来纠正机器的错觉。 这方面,今日头条可以稍微了解一下信息和天天快报。

成功是算法计算出来的,失败也是算法计算出来的。 该算法为今日头条带来了巨大的流量和收入,但也给今日头条带来了被质疑的负面影响。 如何抵御流量的诱惑,真正赢得用户的口碑,是今日头条当下真正需要考虑的。