从PK到流量包:算法逻辑如何激活网文创作?|色窝窝51精品国产人妻消防

  作者:江铭欣

  今年七月,起点中文网进行了建站以来最大的新书推荐算法改革,免费期新书从固定推荐位的四轮“PK模式”改为个性化推荐展示的“流量包模式”。这一改革在作者中引起极大反响和广泛讨论,由此也引出一系列关键却缺乏讨论的问题:什么是网文的推荐算法?推荐模式的变化为何如此重要?PK模式是什么?流量包模式又是什么?

  推荐算法在网文中的应用,实现了海量内容与读者的精准连接,也有效解决了长尾网文的分发与供给。免费平台番茄小说如今日活跃用户近亿,远超付费阅读平台,根本就在于以推荐算法为核心内容的分发模式。因此,原以编辑、运营为主导的,以分发精选为内容组织逻辑的老牌网文平台,也纷纷推出个性化推荐功能。

  与短视频等平台的内容推荐系统一样,网文平台的推荐系统也主要由数据层、算法层和工程层组成。数据层主要分析用户、网文以及用户与网文的交互数据和特征,如用户性别、网文类型、阅读时长等数据。算法层负责从数据中挖掘规律,生成推荐结果。网文平台使用较多的两种推荐算法是基于内容的推荐和协同过滤。基于内容的推荐依赖对网文本身特征的分析,通过赋予内容的类型与标签,结合读者的偏好信息,推荐与读者兴趣相近的网文。例如,历史数据发现读者喜欢看规则怪谈类型的网文,算法就将更多和规则怪谈相关的网文推荐给读者。协同过滤推荐算法则不解析内容本身,主要依赖读者与网文的交互数据,可分为基于读者的和基于网文的。基于读者的协同过滤是找到和读者A相似的读者B,给读者A推荐读者B看过但是读者A没看过的网文。基于网文的协同过滤则是找到观看两个不同网文的用户群体,通过分析两个读者群体的重合度,推算两篇网文的相似度,相似度高则进行合并推荐。一般推荐系统都会混合以上的算法,根据用户操作行为选择不同的推荐策略,无操作时用热门默认推荐,少量操作时用基于内容的推荐,交互足够多时用协同过滤推荐。工程层则是对上述数据和推荐的处理、排序、评估与优化。

  目前主流网文平台所采用的推荐系统多以“top-N预测任务”为核心,以“点击预测任务”为辅助来实现海量作品的个性化推荐。即结合用户的阅读时长、留存率等指标预测用户点击某本小说的概率,根据推算出的推荐分为用户提供排序好的个性化内容列表。网文上传或更新后,会根据其不同特征进入不同的内容候选池,当用户访问推荐feed(即推荐信息流,如番茄小说的首页推荐和起点中文网的猜你喜欢)时,服务端就会请求推荐,系统便会根据用户特征从候选池中召回用户可能感兴趣的网文。经过粗排、精排出的小量级网文,会根据算法模型的预估推荐分来排序,有时也会加上广告或平台力推的内容,在混排后展示为用户浏览页面的推荐feed,由此完成一次推荐。一般来说,猜你喜欢等个性化推荐feed无数量限制,一直刷就一直新。但榜单类推荐资源位的展示数有限,排序只能选取top-N。起点中文网此前的新书推荐位PK模式,即由4轮PK以竞争推荐位(一轮“潜力新书”、二轮“新书精选”、三轮“本周强推”、四轮“小编力荐”),新书需要轮轮晋级才能获得更多推荐。起点以外的付费平台虽未明确标注其推荐为PK模式,但大致原理相同,面对有限的资源位只能曝光推荐分排序前列的作品。

  不难发现,无论是以上哪种推荐算法,都需建立在一定数据上才能进行推荐。新读者、新网文或新类型会因缺乏历史行为数据,无法准确启动个性化推荐的情况。这就是推荐算法中常说的冷启动问题,主要分为读者冷启动和内容冷启动。在读者冷启动阶段,网文平台会主动邀请新注册读者或一段时间未使用的读者提供反馈,包括性别、年龄、地理位置、爱好等信息,以建立读者兴趣画像。部分平台也可通过用户的登录账号,如手机号码、抖音账号等,获得用户在其他平台的行为数据。此外,通过用户的登录设备、时间、地址IP也可获得部分用户信息和场景偏好。新注册读者登录网文平台后,大部分平台会使用混合推荐算法,先是提供大众化、热门、高分的网文内容兜底,再根据读者的初启行为(如停留、点击、阅读)数据,用基于内容的推荐算法给读者推荐他过往观看过的、相似的内容。等用户的基础属性较为完善,有更多的交互数据后,配合协同过滤算法为读者提供更多元的网文内容。例如,新用户登录番茄小说平台,填写用户名和性别为女,首页推荐就会出现较多现代言情女频网文热门大众类型文以及《十日终焉》等番茄小说独家高分文,不同类型的网文也会适度曝光让读者选择。如果用户点击霸道总裁文,无论阅读时长多长,番茄平台都会在下一次推荐feed刷新后推荐更多现代言情文和霸道总裁文。后续也会根据读者相似度和网文相似度,对海量网文进行协同过滤算法推荐,为读者推荐更多新鲜且可能感兴趣的网文。

  这次起点中文网的改革主要针对网文新书的冷启动。从推荐算法角度来说,尽管内容本身有一些关键词标签特征,但由于新书没有用户表达过行为,推荐系统无法判断网文的好坏,也不知道将在候选池中的新书推荐给谁,且新书的自然推荐分排序由于偏后也难以曝光。而得不到用户交互数据,就容易导致恶性循环,破坏作者体验的同时影响新书内容库的增量。因此,大部分网文平台都是强制推荐系统给新网文一定的流量曝光,等有了用户针对这篇网文本身的用户行为,推荐系统再更有针对性地推荐这篇网文。这种流量曝光就是流量包,逻辑即推荐系统中常说的boost。它指的是在推荐分上增加或减少一个数,多由运营和编辑在推荐系统中非自然操作,对于新作、冷门作品和优质作品会进行boost增分,从而提高推荐量,对于低质作品也会deboost减分。一般来说,推荐系统已经在最优用户体验目标上给到每部作品恰当的推荐量,只有在出于冷启动和作者生态角度等业务需求时会适当boost运营。由于新书的前期曝光没有比较精准的个性化推荐,boost实际上是在损失用户体验的基础上做推荐,因此新书的曝光周期和总体流量也会被控制在一定额度。

  在资源位和曝光值固定的前提下,起点中文网做了两种新书推荐机制的尝试。原有的四轮PK模式,会保证新书最少有一轮推荐,即曝光在起点客户端的“潜力新书”中,一轮最长曝光周期为七天,晋级第二轮后会推荐曝光在“新书精选”与“同类作品推荐”,如二轮PK失败则基本再没有曝光可能,除非联系编辑复活上推。晋级第三轮后曝光在“本周强推”,第四轮晋级则曝光在新书推荐中位置最好、流量最大的“小编力荐”。这种模式让不同等级的上推会获得不同程度的曝光,PK晋级多的作品可获得多次曝光和更优的推荐位,PK晋级少的作品则可能一轮游,由于无推荐而苦苦坚持创作或快速切书。新的流量包模式则是不固定推荐位,为更多新书提供了长周期的候选推荐和更多资源位曝光可能。如新书入库作品首次亮相后,会提供试水期和培育期流量推荐。新书在七天试水期中均匀获得流量扶持,再根据作品表现获得不同档的流量包boost。优秀作品会获得更高档次的放量流量包boost,表现欠佳的新书也不会被雪藏,也能在培育期获得持续21至42天的扶持流量包,让推荐系统和新书新人有更多试错和调整的可能,也避免作者过度追求前期流量而损害后期发展。

  目前各内容行业推荐系统的推荐原理、算法、流程都大概一致,只是由于商业模式的不同,番茄小说等免费平台对人工智能推荐有相对充分的放权,起点中文网和晋江文学城等付费平台则有更多的编辑人工参与。总体而言,起点中文网这次新书推荐算法改革,表面上是将PK模式变为流量包模式,实质则在于对新书培育周期的拉长以及不限资源位向人工智能个性化推荐的让权,旨在推动作者和作品更加注重长期效益而非短期利益。

  (作者系中山大学中国现当代文学硕士研究生)

2023nian7yue,zhonggongzhongyangzongshuji、guojiazhuxi、zhongyangjunweizhuxixijinpingzaisichuankaochashizhichu,sichuanyaofahuigaoxiaohekeyanjigouzhongduo、chuangxinrencaijijudeyoushihechanyetixijiaoweiwanshan、chanyejichuxionghoudeyoushi,zaikejichuangxinhekejichengguozhuanhuashangtongshifali。2(2)02(2)3(3)年(nian)7(7)月(yue),(,)中(zhong)共(gong)中(zhong)央(yang)总(zong)书(shu)记(ji)、(、)国(guo)家(jia)主(zhu)席(xi)、(、)中(zhong)央(yang)军(jun)委(wei)主(zhu)席(xi)习(xi)近(jin)平(ping)在(zai)四(si)川(chuan)考(kao)察(cha)时(shi)指(zhi)出(chu),(,)四(si)川(chuan)要(yao)发(fa)挥(hui)高(gao)校(xiao)和(he)科(ke)研(yan)机(ji)构(gou)众(zhong)多(duo)、(、)创(chuang)新(xin)人(ren)才(cai)集(ji)聚(ju)的(de)优(you)势(shi)和(he)产(chan)业(ye)体(ti)系(xi)较(jiao)为(wei)完(wan)善(shan)、(、)产(chan)业(ye)基(ji)础(chu)雄(xiong)厚(hou)的(de)优(you)势(shi),(,)在(zai)科(ke)技(ji)创(chuang)新(xin)和(he)科(ke)技(ji)成(cheng)果(guo)转(zhuan)化(hua)上(shang)同(tong)时(shi)发(fa)力(li)。(。)

发布于:北京市