天天看点

洪杰文、常静宜 | “有意” “无意”之间:B 站青年的算法身份建构研究

作者:再建巴别塔

本研究将身份建构问题置于智能媒体环境中,以哔哩哔哩用户为例对青年群体的算法身份建构加以考察。通过参与式观察和深度访谈发现:B站青年用户已经具备一定的算法意识并随之形成了算法身份想象,其作为前置条件对算法身份建构行为产生影响。一方面,B站青年的算法意识觉醒仍不彻底,致使其“无意识”地顺应平台规则,陷入“自我标签化”、自我兴趣展演和互动“狂欢”的被动身份建构过程;另一方面,B站青年已具备的算法意识又使其主观能动性得以发挥,“有意识”地通过算法修辞、算法“失灵”后的身份纠偏和社区讨论中的平台改造等方式主动建构算法身份。总体来说,B站青年的算法身份建构游移于“无意”与“有意”之间,具有后台化、动态性和改良型的特征,呈现出人与算法自在自如相处的新的可能性。

一、引言

伴随着云计算、大数据等智能技术的广泛应用和发展,算法与信息环境的结合日益深入,算法将互联网上的我们划分为种种类属,试图用0和1为我们塑造一种有别于现实身份的算法身份(algorithmic identity)。算法身份不同于以往我们在现实生活中的身份认定或目标明确的身份表演,而是算法依照数据对我们进行的身份阐释,其自动确定了我们的性别、阶级、种族等身份特征(刘培,池忠军,2019)。面对无处不在、无孔不入的算法,身处其中的每个个体都无法摆脱这件名为算法身份的“新衣”,厘清算法身份的内涵及建构过程能够帮助我们揭开智能社会复杂图景的一隅。

学术界已经关注到了算法身份的问题,但更加侧重以平台(“身份分类者”)为中心的研究思路,围绕算法平台的技术分类和资本控制逻辑展开。而用户(“身份拥有者”)的个体认知和能动性在算法身份研究中较少体现。用户在认知层面能否形成算法意识及算法身份想象?在行动层面采取何种方式建构算法身份?前者又对后者产生怎样的影响?为了深入研究这些问题,本文引入算法意识要素,实现从“分类者”到“拥有者”的视角转换,这有助于重新审视人的自由意志和个性拓扑形式在算法社会中的影响力。本研究聚焦作为新媒介技术“先行者”的青年群体,考察其算法意识、算法身份建构方式以及与算法平台的互动博弈,进而帮助我们以青年视角为棱镜,折射算法时代用户媒介使用中的创新实践,探索人与算法共生关系中新的可能性。

二、文献综述

(一)概念渊源:从数字身份到算法身份

身份(identity)是现代社会从未停止讨论的议题,在不同的理论视野和学术语境中的内涵具有多义性。身份或被认为是自我与他人之间的区隔,“界定自己的性格和态度的特征,这将自己与他人区分开来”(陈安繁,金兼斌,罗晨,2019);或被认为是成员在社会中的位置,其包括特定的权利、义务、责任、忠诚对象、认同和行事规则,还包括该权利、责任和忠诚存在的合法化理由等(张静,2006:4);或被认为是文化语境中人们对于个人经历和社会地位的阐释和建构(项蕴华,2009)。身份的表现和解读在历史、文化和结构上都是偶然和流变的(Davis,2015)。

互联网时代,线上与线下的分离使得传统身份扩展出数字身份(digital identity)概念。何祎金(2021)认为,在物理时空的身体之外,在不同节点的网络空间中,存在与之形成映射的数字身份,两者之间有着密切的关联却又非完全对应。数字身份是允许个人在互联网协议中被识别和个性化的特征,是网络参与的个体通过个人资料、互联网账户、评论、照片、文本、视频及其他可见载体等表示的身份(Martinez et al.,2021)。通过数字身份,我们获得了在网络中被识别以及参与不同活动的可能性和对应权限。从这个意义上说,数字身份是我们在互联网上开展的所有活动和记录的广泛全景的一部分。

进入智能社会后,智能技术广泛渗透和应用于社会生活的方方面面,数字身份的内涵和形态继续发生变化,“算法身份”概念应运而生。约翰·切尼-利波尔德(John Cheney-Lippold,2017:25)认为我们遗留在互联网上的行为、面孔甚至情感都被算法一一捕捉,算法将提取到的个体数据,与大量用户数据清洗后形成的数据库进行配型,为我们精心打造了一个由0和1构成的算法身份。刘培和池忠军(2019)将算法身份界定为“算法基于数据主体的数据足迹而推断出来的分类,其自动确定了个体的性别、阶级、种族等身份特征”。林凡和林爱珺(2022)从主客体角度提出,算法技术等非人因素通过塑造用户形象对人产生技术意向性,使得原本运用算法的主体成为被算法处理与开发的客体。这些关于算法身份的定义和表述强调了算法对人的客体化,但某种程度上对人的主体性有所忽视。因此,本研究尝试将焦点从算法等非人主体转移到人类主体上,以期对算法身份的概念内涵进行一定补充。

(二)算法身份建构中的平台与用户

1.平台:基于技术和资本逻辑的身份分类者

在整个现代性过程中,身份是通过符号表现、科学思考和制度化的过程被建构出来的,人口普查、心理调查或医学分类法等手段被用来将人分类成可知、稳定和相对无争议的类别(Kotliar,2020)。但如今,越来越多的人被算法分类,而算法倾向于动态创建不可数、未命名和无法破译的集群。利波尔德挪用马克思·韦伯(Max Weber)的“理想类型”(ideal type),提出“可度量类型”(measurable type)概念以表示这些集群,即算法通过挖掘用户数据将其划分进入的各种类属。结合蒂齐亚纳·泰拉诺瓦(Tizianan Terranova,2004)的“微观态-宏观态”理论,作为宏观态的可度量类型又是由作为微观态的多维互动行为数据形成的。于是,智能时代的我们从“原子我”转变为“数据我”(Lippold,2017:16)。

安托瓦内特·鲁弗鲁瓦(Antoinette Rouvroy,2012)将算法分析描述为“数据行为主义”——一种产生知识的方式,它绕过了“传统”的意义制造过程,因此忽视了人类主体的反身性、散漫性或道德能力。安德烈耶维奇(Andrejevic,2013;135)认为算法对用户身份的分类是一种忽视预先存在社会类别的“后理解”(post-comprehension)信息策略。费舍尔(Fisher,2019)对此提出了“算法认识论”,算法并不通过分析和经验来理解用户行为的原因,而仅仅是为了能够识别用户的行为模式。由于个体可以适应成千上万的规则,“算法认识论”废除了个体属于二元(如男人/女人)或其他离散人口类别的概念,而是提供一个更微妙的凝视。算法可以创建一个基于行为的量表,从而认为个体或多或少是女性化的或男性化的,将人们视为动态的、生动的数据混合体(Kotliar,2020)。算法根据用户数据而动态创建的各种类属之间交叉组合,形成了用户的算法身份。这种身份不再被束缚于某种严格的、永恒的概念之上,随时随地可以被调节、重写甚至擦除,身份原本稳定的本真性也变得模棱两可。

技术不是完全中立和价值无涉的,因此在算法技术逻辑的背后还要考虑到平台所嵌入的政治经济关系。从平台权力角度来看,劳伦斯·莱辛(Lawrence Lessing,2006)认为代码是网络空间的“法律”,平台作为规则制定者对代码的控制就是一种权力。利波尔德(Lippold,2017:160)提出算法平台存在一种更为间接和隐蔽的“软生命政治”(Soft-biopolitical)权力形式,平台通过聚类模型和庞大数据库建构种种类属从而控制用户的身份表征。从资本积累角度来看,克里斯蒂安·富克斯(Christian Fuchs,2013)的“数字劳工”和“互联网产消者”理论认为,平台在用户使用过程中监测其行为数据、分析其消费兴趣,然后将这些作为商品出售给第三方广告商或用于改进自身服务,从而完成资本的循环积累。用户不仅是服务和广告的接受者,也是个人行为数据和自身分享内容的生产者。肖沙娜·朱伯夫(Shoshana Zuboff,2019)也提出“监控资本主义”(surveillance capitalism),认为平台把人的行为数据转化为虚拟商品,通过预测分析来控制和指导人们的行为。

因此,即使种种研究表明算法身份并非戴维·里昂(David Lyon,2001:22)的“数据孪生”(data doubles)那样可以看作线下真实身份的翻版,但对于平台而言,相比于用户的真实身份,能够刺激用户消费、实现资本积累的算法身份才更有价值。隐藏在算法技术逻辑背后的是基于资本逻辑的平台价值选择,其可能有违用户的个体利益和价值观,但平台可以通过强大的“合理性力量”影响用户的选择和决策,甚至控制用户的行为和活动(全燕,陈龙,2019)。

2.用户:基于个体认知和能动性的身份拥有者

算法身份显著区别于传统身份的分裂、流动、反本质主义等特性,使得基于技术和资本逻辑的平台“身份分类者”视角成为算法身份研究的主导视角,而对用户作为算法身份拥有者的个体认知和能动性方面关注不足。

首先,身份建构于自我认知的基础之上,人首先要回答“我是谁”的问题,才能从身份认知中发展出身份认同进而建构自我身份(项蕴华,2009)。而对于算法身份,除了自我认知之外还涉及用户对算法及算法身份的认知,即回答“在算法中我是谁”的问题。学者们将人们对算法的认知程度定义为“算法意识”,包括对内容过滤、自动决策、人机交互及道德考虑等方面的认知(Brahim, 2021)。诸多研究都表明用户具备一定的算法意识,但存在程度上的显著差异(Emilee, Rebecca,2015;Proferes,2017;黄忻渊,2019;Gran et al.,2020)。最基础的算法意识是用户仅仅感知到搜索结果并不平等地显示所有信息源,某些信息会被优先考虑(Eslami et al.,2015);在此基础上,用户有可能形成对算法的具体排序标准和代码原理的理解(Devito et al.,2018);更甚至是对技术底层逻辑中存在的伦理问题的批判性理解(Rieder,2016)。利波尔德认为用户的算法意识为算法身份与真实身份之间的流动和弥合提供了可能(Lippold, 2019:166-179),但对于究竟如何成为“可能”并未深入论述,用户的算法意识在算法身份建构中的作用有待进一步研究。

其次,既有媒介实践中的身份建构研究表明,用户能够随着媒体技术的演进而采取不同方式建构自我身份,这些多样而灵活的身份建构策略体现了用户的主观能动性。BBS时期,用户多采取以兴趣为导向、凝聚小共同体的策略进行“部落化”身份的突出表达;微博网页时代,用户综合运用多媒体元素建构鲜活的立体化网络身份;以微信为代表的社交媒体时代,社交展览与即时通讯的结合使得“永远在场”成为身份建构的主要模式(吕宇翔,2021),同时运用情感元素建构和强化自身的身份属性和社会关系(陈安繁,2019);那么进入算法广泛应用的智能媒体时代后,用户又会如何发挥能动性、采取何种策略建构身份有待研究。其中,青年用户群体往往扮演着新媒介技术的“先行者”角色(晏齐宏,2023),也是接触算法技术最广泛、受到算法技术影响最深刻的群体(赵龙轩,林聪,2022),青年群体在智能媒体实践中的能动性发挥和算法身份建构值得进行细致考察。

另外,任何一种身份都不是一成不变的,个体的能动性还体现在自我与他者的交流和互动中。库利(Cooley)的“镜中我”指出人对自我的认知来自他人的反应,甘迪(Gandy)也认为身份是在与他人直接和间接互动过程中形成的,这其中包含来自外部和内部双方的力量(方亭,2008)。个体通过多种策略将自我认知进行外在表征,并运用反思性能力在与他者的互动中不断调整和修正身份(李沁柯,夏柱智,2021),自我期望与他者反应在互动中相互影响,最终趋向自我认同身份和他者认可身份的统一(覃明兴,2005)。随着智能时代到来,人-技关系中人的绝对支配地位被打破,技术不再仅仅作为被支配的工具,甚至反过来控制和支配人。在平台这一人-技混合异质系统中,算法成为一种新型“准他者”(蒋晓丽,钟棣冰,2022),用户与算法技术及背后平台的身份建构博弈同样值得研究。

基于此,本研究以哔哩哔哩(bilibili,下文统称B站)用户为例对青年群体的算法身份建构加以考察,重点关注B站青年在算法身份建构过程中的认知与行动,以期对前人研究进行一定呼应和补充。主要研究问题包括:在认知层面B站青年形成了怎样的算法意识和算法身份想象?在行动层面B站青年采取何种方式建构算法身份?前者又对后者产生了怎样的影响?B站青年的算法身份建构整体上呈现出怎样的特征?

三、研究设计

B站是国内主要的ACG内容创作与分享平台,通过算法机制将海量用户转化为“共同行为者”(何苑,张洪忠,苏世兰,2022),现已成为覆盖7000多个兴趣圈层的多元文化社区。B站与抖音、快手、小红书、今日头条等同属于国内代表性的算法平台,相比之下B站的交互功能最为复杂多样(包括发弹幕、关注、分享、点赞、投币、收藏、评论、不喜欢等),这使得B站算法所涉及的用户数据类型更加多元,B站用户的身份表达和呈现也更加丰富。因此,本研究选择B站作为研究平台。

2021年哔哩哔哩公共政策研究院院长谷雨在演讲《云秀活力·网络新青年·青春正能量》中指出,B站的核心用户为“Z世代”(1995—2009年出生人群,目前年龄为14至28岁)。2022年b站服务商“蓝狮问道”最新数据显示,B站18—30岁用户占比78%,用户男女比例基本持平。陈峻俊(2022)等人针对B站用户的年龄、学历、居住地进行描述性统计分析后,认为B站群体具有年轻化、以学生为主体的特征。综合上述数据,本研究认为18—28岁的青年群体为B站的核心用户群。基于此,本研究以B站青年为研究对象,采用参与式观察和深度访谈相结合的方法进行研究。其中参与式观察的主要目的在于,研究者通过进入B站社区并通过长期观察收集视频信息、文章、弹幕、评论等材料,分析B站青年的身份建构行为及互动模式;深度访谈的主要目的则在于直接获取B站青年的一手访谈资料,以分析其对算法的认知、主观想象和行为动机等。

研究者于2022年7月至8月,以“算法”、“大数据”等为关键词检索到相关视频121个、专栏文章24篇,剔除不相关内容后,在B站社区中获取弹幕、评论、专栏文章等文本材料约8400字;于2022年7月27日至8月25日,通过微信朋友圈和B站后台私信的方式进行访谈对象招募。为保证对B站的熟练使用,访谈招募条件为使用年限1年以上、等级Lv3以上的B站用户。研究者共对25名访谈对象进行了30分钟到60分钟不等的访问,其中18名为线上访谈,7名为线下访谈,在获得访谈对象的知情同意后,对访谈过程进行录音或文字记录。本研究选取的访谈对象基本情况如表1所示,年龄集中于18—28岁,男女性别比为13:12,学历涵盖高中、本专科、硕士及以上,其样本特征与B站核心用户特征基本保持一致,可认为其具有一定的代表性。

访谈共包括四部分:研究者首先询问了访谈对象的基本信息(年龄、使用年限、B站等级等);然后使用通俗化的语言询问访谈对象对算法和算法身份的理解和评价,例如使用“B站刷到的内容”代替“算法推荐”概念,“B站认为您是什么样的人”代替“算法身份”概念等;进而围绕访谈对象在B站中的身份建构行动和策略进行询问,例如“您会通过什么方法来调整在B站刷到的内容”等;最后询问这些行动策略所产生的效果和感知到的算法身份变化过程,例如“当您……之后情况有什么变化”等。访谈结束后,对访谈记录或录音进行逐句转录,筛选提取出与研究主题相关的内容,共得到文本材料约2.4万字。

洪杰文、常静宜 | “有意” “无意”之间:B 站青年的算法身份建构研究

四、研究发现

(一)算法身份建构的前置条件:算法意识觉醒与算法身份想象

1.基于互动关系链条的B站推荐算法

由B站“隐私政策”中提供的《个人信息收集清单》可知,B站收集了用户身份信息(包括性别、IP属地、出生日期、学校、设备信息、第三方ID等)、个人财产信息(包括住址、交易内容、会员订购记录等)和浏览与互动信息(包括关注、分享、点赞、投币、收藏、评论、不喜欢/举报、播放时长、历史记录等)三类信息用于个性化推荐服务。平台通过收集这些信息进行用户画像,涵盖需求、行为、兴趣、心理、性格等多种用户属性(吴剑云,胥明珠,2021),与此同时,通过各项指标对视频进行分类管理,涵盖视频特征、视频内容、相关人员等多种视频属性(何苑等,2022),最终实现用户属性与视频属性之间的精准关联匹配。

不同的数据指标在B站算法中具有不同的权重。根据官方披露和用户讨论(具体内容可见B站帮助中心和专栏文章),B站的视频推荐采用的是“强关注”模式,即“关注”数据的权重最高。算法会优先把用户所关注UP主的视频推荐给用户,这也符合很多B站用户先打开“动态”(即用户关注的人所发布内容)页面看视频的习惯。除此以外,“分享”和“评论”指标在B站推荐算法中的权重也较高,“弹幕”、“投币”、“点赞”、“收藏”次之,“播放”权重最低。原因在于,关注、分享等行为相比播放行为具有更强的互动性,对于用户来说成本更高,更能代表用户对于视频的感兴趣程度。整体来看,B站采用的算法是基于互动关系链条的个性化推荐算法,互动性越强的行为数据权重越高,这些视频被推荐的概率也更高。

2.B站青年的算法意识觉醒

根据前人研究,我们将算法意识划分为“基本感知”、“逻辑理解”和“批判反思”三个层级,对25位受访者的算法意识觉醒程度进行了评估。首先,所有受访者均能够“基本感知”到B站算法的存在,即在访谈中明确表述出B站推送的内容是“因人而异”、“投其所好”的。其次,大多数受访者(22位)达到了算法意识觉醒的第二层级“逻辑理解”,即能够清晰地列举出可能的内容推荐依据,但这种理解并不全面。其中最常被受访者提及的是播放行为对推荐结果的影响,例如“我感觉是根据我平时浏览的视频来推荐”(F9)、“刷到过几次某明星的视频,就会一直推送同明星或者同节目的视频”(F1)、“在每个视频播放完毕后会有相关推荐,都是一些和视频相关,或者和我平时浏览的内容相关的内容”(F3);受访者对于关注行为与推荐结果之间的关联也比较敏感,例如“关注的UP主更新会推荐在首页”(F4)、“我关注了很多游戏主播,首页推荐里频繁出现游戏内容”(M7);少数受访者也能够感知到“一键三连”(点赞+投币+收藏)行为与推荐结果的关联,例如“被我‘一键三连’之后,再刷新就会出现相似视频”(M8);而受访者关于分享、评论行为与推荐结果之间的关系感知不深。

进一步分析发现,“逻辑理解”层级的算法意识主要源于用户在使用过程中获得的直接经验。受访者往往会例举自己在B站使用中的体验和经历来佐证其与推荐内容之间的相关性。浏览是受访者在B站平台上最为频繁的操作,其与推荐结果的关联性也最容易被受访者觉察;而分享、评论等行为均需要受访者进行两步以上的额外步骤且面临一定的社交压力,导致执行这两种行为的频率大幅降低,它们与推荐结果之间的关联对受访者而言也更难以判断。受访者通过投入时间和精力使用B站平台,不知不觉参与到算法运作的过程中,在广泛接触算法技术的过程中,加深了对算法逻辑的理解程度。从这种意义上来看,算法是一种“不直接使用就不容易理解”的技术(Grant, William,2012)。而只有少数受访者(5位)能够达到算法意识的“批判反思”层级,主要表现为对B站算法推送内容同质化的反思。例如“经常一刷B站就停不下来,算法太容易让人沉迷了”(M2)、“我经常看到很多重复、类似的视频,所以有时候觉得B站推的内容把我局限在里面了”(M9)。整体来看,访谈中的B站青年已经有了一定程度的算法意识觉醒,但大多停留在基本感知算法存在和部分理解算法逻辑的程度。

3.B站青年的算法身份想象

研究发现,B站青年算法意识觉醒的同时也随之形成了对算法身份的想象。当被问及“您认为B站对您有哪些身份定位”时,大多数受访者都能回答出三条以上的特征,并且能够举出相关例证。在受访者形容自己的算法身份时,兴趣爱好是被提及最多的身份特征,如“老LOL玩家(指游戏《英雄联盟》的忠实玩家)”(M10)、“健身爱好者”(M4)、“哈迷(指作品《哈利·波特》的粉丝)”(F3)等;而性别、年龄、地域等特征则较少被提到,如“武汉大学生”(M9)等;财产信息则完全没有被提及,甚至有受访者对此表示了明确的否定,“(我)感觉B站应该不能知道我的经济状况吧”(F8)。

对照前文《个人信息收集清单》中的三类信息可以发现,受访者想象中的算法身份侧重于个性和兴趣特征,而较少关注与现实身份联系更紧密的基础身份特征,甚至忽视个人财产信息特征。其原因在于,虽然B站向用户提供了《个人信息收集清单》和《隐私服务协议》,但对于绝大多数受访者来说,并不会细致阅读B站提供的“超长”隐私协议,即使有所留意也很难完全理解其专业术语,而将之关闭后也再难找到这些说明和协议的所在位置。通过调查和统计,25名受访者中仅有2名主动搜索和查看过B站的信息收集和隐私相关信息,但一位表示“看不懂”(F1),另一位则“没有找到”(M10)。而其余受访者则均表示B站在“开屏”界面弹出的隐私政策被直接忽略了,而且只在初次下载和登录时看到过这种弹窗。可见,B站青年能够形成一定的算法身份想象,但是算法技术作为企业机密的一部分,平台所有者不可避免地隐藏或掩盖有关其具体算法的细节(Pasquale,2015),制约了这种算法身份想象的准确性和完整度。

结合后文对算法身份建构过程的分析,研究者认为B站青年的算法意识觉醒以及随之形成的算法身份想象是建构算法身份的前置条件。一方面,B站青年对算法“薄弱”或“不彻底”的认知想象会导致其“无意识”地顺应平台规则,被动参与进算法身份的建构过程而不自知。但另一方面,B站青年已经觉醒的部分算法意识又使其主观能动性得以发挥,“有意识”地积极采取多种方式建构算法身份。

(二)“无意识”的算法身份建构:平台控制引导下的被动合作

1.算法框架下的“自我标签化”身份拆解

根据霍华德·索尔·贝克尔(Howard Saul Becker)的标签理论,“贴标签”行为是指标签主体基于特定的社会文化背景、事实和判断,主观地给他者进行意义框定。“标签化”就是通过“贴标签”的方式将某人或某物归于一类并加以共同概括(王钰琪,2021:16-19)。而算法平台中的“标签”是对用户特征和内容属性的定位,用以辅助平台进行规则的设置和运作,用户成为被算法“标签化”的客体。算法通过内容和用户“标签”的精准匹配,实现视频内容的优先级推送和用户界面的个性化定制。

研究发现,B站青年在被算法“贴标签”的同时,也不自主或不经意间顺应算法框架对自我身份进行拆解,研究者将其形容为“自我标签化”。访谈中发现:从注册账号开始,受访者便通过填写用户资料,为自己贴上了“90后”、“00后”、“大学生”等各种标签;在浏览视频时,受访者按照B站分区将自身兴趣点自动归类到“番剧”、“电影”、“电视剧”、“音乐”、“舞蹈”、“游戏”等标签下;当受访者上传视频时,B站会要求其为创作视频也打上具体的细分领域标签、热点话题标签等;除此以外,B站从2022年7月18日起依据相关法律法规公开账号IP属地,地理位置标签也被强制性展示出来。随着“标签”结构在界面的外显和后台的内嵌,B站青年从进入B站、注册账号到按需观看、发布内容的每一个环节,都在将自身复杂的“多面体”身份进行概括化、特征化、扁平化处理。

更重要的是,“标签”具有导向定性作用, 会对个体的自我认知产生影响。由于自我验证、自我同一性、自我印象管理等方面的原因(段锦云等,2014),个体倾向于使自己的行为与所贴的“标签”内容相一致,即形成“标签效应”(Guadagno,2017)。B站平台借助算法规则给用户贴上“标签”,用户也在算法框架的影响下逐渐向“标签”所标定的方向行动,例如有受访者在B站搜索做菜教程视频后被推荐了大量美食视频,最后“被培养成了做菜爱好者”(F8)。但多数受访者表示已经习惯于通过各种各样的垂类和关键词来快速定位感兴趣的视频,对于这种“标签效应”难以察觉、缺少反思。

2.显式与隐式交互中的自我兴趣披露

除了“贴标签”之外,研究发现B站青年还被平台精心设计的交互方式所引导,对自身兴趣爱好进行不自觉的披露。B站中的交互方式分为显式与隐式两种,其中显式交互包括分享、点赞、投币、收藏、评论、关注、发弹幕等呈现在B站应用界面上的交互方式,而隐式交互则包括屏幕操作轨迹、视频完播比例、界面停留时长等未直接呈现在B站应用界面上的交互方式。用户的显式或隐式交互被平台实时监测、回收、评价,推动算法身份的生产与再生产,其交互对象、方式和程度的变化也会导致算法捕捉到的身份特征处于瞬时更新和变动中。

首先,显式交互往往能够直接反映用户的个人偏好。在访谈中发现,多位受访者表示遇到喜欢的视频会进行分享、点赞和投币等操作,遇到反复推送令人厌烦的视频会长按选择“不感兴趣”等:“我一般会在某个原创视频特别打动我的时候‘一键三连’”(F5),“如果遇到我不想看的视频,一般我会直接刷掉,但如果反复推送,我就会选择长按‘不感兴趣’,基本上就看不到了”(F7)。其次,隐式交互同样会被算法捕捉用于用户侧写,例如不完整播放、完整播放和重复播放所代表的感兴趣程度递增,界面停留时间越长也代表用户感兴趣的可能性越高等。但由于隐式交互的作用方式更加隐蔽,多数受访者难以察觉到隐式交互对内容可见性的影响,对于B站算法的理解仍存在盲区。除此以外,B站还会通过隐式交互设计来激发和引导用户进行显式交互。例如,B站视频的播放时长达到一定标准后,在视频画面的醒目位置中会出现“一键三连”图标;在B站介绍页面停留一段时间后,下方的“分享键”也会从灰色的箭头转变为鲜艳的绿色微信图标等(见图1)。

洪杰文、常静宜 | “有意” “无意”之间:B 站青年的算法身份建构研究

3.弹幕机制下的情感激发与互动“狂欢”

B站独特的弹幕机制在某种程度上促成了UP主与平台的“合谋”。根据B站的算法机制,弹幕/评论/点赞多的视频会被推荐给更多用户。算法驱动UP主以这些指标为追求,不得不想方设法引导用户积极参与互动。例如,一些有经验的UP主会将弹幕机制与“一键三连”机制搭配起来,在视频的开头或结尾通过巧妙话术提醒视频观看者“一键三连”。这种“套路”有时确实可以奏效,受到提醒的观看者可能会“顺手点个赞或者投个币”(F5),也有时会激发观看者的“逆反心理”,形成大量弹幕刷屏回应“下次一定”等调侃话语的现象。但无论“套路”是否奏效,UP主都处于双赢局面,即使没有获得“一键三连”也收获了大量弹幕,从而提高了视频的推荐力度。

在此基础上,弹幕机制还会引发用户情绪/情感体验的相互感染,形成互动“狂欢”。例如在热门视频的弹幕区中,刷屏现象频繁出现且规模庞大,甚至达到完全遮蔽视频画面的程度。有受访者表示“刷屏”会令自己产生更强烈的表达欲望以及身份归属感和融入感:“我比较喜欢发弹幕。会更大胆一点,隐藏在一大堆弹幕中间,或者直接复制别人的弹幕,我就没那么有‘羞耻感’”(F2)、“如果大家都在吐槽,我也会忍不住发弹幕,有时候是一起吐槽,有时候会反驳”(F3)、“弹幕中的很多梗‘懂的都懂’,大家默契地一起刷屏,会让我产生融入这个圈子的感觉”(M1)。而且,弹幕/评论空间中的符号是非即时的,不同时间的弹幕/评论汇集在同一个空间,形成繁荣的“在场”假象,从而造成了“狂欢”的持续。除非被B站审核人员后台下架或清理,弹幕区和评论区会留存用户发送的每一个文字、每一份情绪,受到感染的后来者如股股细流不断汇集加入其中,形成情绪的洪流。弹幕空间中的B站青年被情绪包围,更容易融入狂欢人群,大声表达。

比尔(Beer,2009)用“技术无意识”形容用户难以察觉信息技术对日常生活的形塑。本研究认为,B站青年对算法的理解和反思仍不彻底,致使其难以摆脱平台规则控制,存在部分算法技术“无意识”状态:B站青年在算法框架下进行“自我标签化”的身份拆解,被平台交互设计所引导进行自我兴趣披露,以及在弹幕机制中被激发情感陷入“狂欢”。“无意识”状态下的B站青年与平台之间形成了不平等的合作关系,其中平台是主动施加控制的一方,而B站青年是被动接受和被潜移默化的一方,不知不觉投入到数据原料生产和算法身份建构过程中。

(三)“有意识”的算法身份建构:“顺从但不屈从”的主动策略

1.“戏谑文化”环境中诞生的算法修辞

在B站独特的“戏谑文化”环境影响下,B站社区内涉及算法和大数据的讨论少有严肃深奥的科普,多以幽默调侃的话语风格进行。观察和访谈中发现,当B站青年发现推荐内容很符合兴趣时,会戏称“号养好了”以表达对算法的满意,而当推荐内容过于同质化时,B站青年同样会自嘲“号养好了”以表达不满。类似表述还有:“我成功把首页全刷成了某某”(M5)、“这号已经被我养歪了”(来自B站评论区)等。所谓“养号”暗含了B站青年将算法当做“驯养”的对象,一方面表露出B站青年已经感知到自身为算法运转提供了“养料”,另一方面也展现出B站青年在与算法互动过程中的主体意识。另外,B站评论区和视频标题中还存在“请大数据记住我”、“大数据懂我”等拟人化修辞:“评论一下,大数据请务必记住我”、“发个评论,免得大数据以为我不喜欢”、“必须得评论一下让B站知道我爱看这个”(来自B站评论区)。

B站青年对算法的“戏谑调侃”展现出用户除了被算法操纵和消极抵触算法之外,还可能以一种轻松积极的态度与算法自在相处。不过,研究者通过亲身参与和访谈发现,在B站内发送一段时间的“大数据记住我”等文本后,B站的算法推荐结果并未出现特别明显的指向性改变,仅有在评论区发布此类内容会唤起算法的一定反应,但这种反应也难以归结为算法“回应”了B站青年的呼唤,因为在评论区发布任何内容,都会被算法捕捉为一条数据记录进入固定的反应程式中,从而可能得到同样的推荐结果。一些受访者也直言“(我发)‘大数据记住我’就是在玩梗,实际应该没多大作用”(F6)。

进一步访谈和观察后发现,在一条“大数据记住我”的评论之下往往会聚集多条类似话语的回复、跟评等,这些算法修辞形成一种“梗”,具有极强的感染力和传播力。研究者认为,B站青年“大数据记住我”的呼唤对象并不主要是算法技术主体,而更可能是作为围观者的其他用户。“大数据记住我”是B站青年对自身兴趣的一种幽默表达,其固然期望这句呼唤能够被算法捕捉,但更加期望的是能够引发相同兴趣用户的群体回声。主打个性化的算法似乎以将用户区隔为单独的个体为目的,但是B站青年的算法修辞表明,用户同样可以能动地借助算法规则,将算法识别的记号变成群体成员互相识别的暗号。“大数据记住我”的评论构成互动仪式,通过跨越时空的情感互动实现参与,方便了用户个体寻找所属趣缘群体、融入圈子从而达成身份认同,满足自身的表达欲和分享欲。某种程度来说,B站青年的算法修辞是一种“无用之用”。

2.算法“失灵”后的身份纠偏与调整策略

人的行为本身是高度灵活和不可预知的(罗伯森,2011:65),对于用户来说不同的行为选择背后都有不同的深层动机。例如,点赞和投币意味着“感谢UP主视频制作不易”(F3、F7、F11),一般是对视频制作者的精心制作和投入成本进行肯定和感谢,但并非所有此类视频都是用户想要经常看到的;而收藏多是由于视频内容较长或集数太多,需要“先码住以后再看”(F7)。

在访谈中发现,很多受访者都表示曾有过对算法“失望”的经历。算法难以把握用户动态行为背后的复杂心理动机和真实需求,从而导致算法“失灵”,其主要表现为正反馈和负反馈的双向“失灵”。B站青年对于感兴趣的视频会采取浏览视频或“一键三连”等正反馈行为,而对于不感兴趣的视频通常会选择无视或选择“不感兴趣”等进行负反馈,其中暗含的期望是B站能够根据自己的反馈行为数据来调整推送结果,“希望刷新到的感兴趣视频越来越多”(F2)或“不想再看到这类视频”(M2)。

然而在实际使用中,一方面,正反馈的“过度灵敏”使得算法超前预测用户兴趣,可能导致推荐偏差,或者同质化内容泛滥:“我只是听某节目的某几首歌,但它会给我推送整个节目或节目其他艺人的视频”(F4)、“以前在各种五花八门的视频里总能找到自己的‘菜’,但现在B站更像某某区站,变得非常单一”(M9);另一方面,负反馈的“不灵敏”使得算法滞后于用户需求,导致用户体验感严重降低,甚至由于“不感兴趣”按键在界面中位置隐蔽,需要用户长按视频几秒或点开视频右上角才会出现,对于许多用户来说负反馈的渠道本身就是不通畅的:“有些我已经不感兴趣的内容还是会被推荐”(F5)、“我从来没有点过‘不感兴趣’,都不知道这个在哪里”(M3)。

在“失灵”的算法使用体验中,具备了“基本感知”和“逻辑理解”两层算法意识的受访者,能够逐渐察觉到算法身份与预期相比存在超前和滞后现象,可能会通过强化身份特征以纠偏算法身份。例如,一些受访者表示自己会采取“两极分化”策略,只有遇到特别喜欢或感兴趣的内容时才会进行互动(发弹幕、评论、“一键三连”),遇到不喜欢或不感兴趣的内容主动规避(绝不点击)或者进行深度反馈(多次点击“不感兴趣”并详细反馈原因,包括“不想看该UP主”、“不想看该分区”、“不想看该频道”、“此类内容过多、推荐过”等选项)。另外,还有受访者采用“主动搜索”的策略来调整算法身份,这种策略一般适用于算法身份中存在特征缺失的情况。当B站青年对某一事物产生兴趣或需要获取某方面的知识信息,而算法又无法及时捕捉到这一变化的时候,B站青年会通过直接搜索行为来激活算法,以主动更新和塑造算法身份。可见,当面对算法“失灵”时,B站青年并非完全听之任之,而是能够主动利用算法规则实现对算法身份的纠偏和调整。

3.社区讨论中的算法应对和平台改造尝试

研究发现,一些B站青年能够发现算法的局限性并对其进行反思,进而在社区中积极讨论如何应对算法和改造平台,以掌握算法身份建构的主动权。主要涉及两种社区讨论形式:一是用户之间的讨论。例如在B站内部评论区积极讨论“如何‘养号’”、“如何防沉迷”、“如何刷到高质量视频”等话题,这种讨论也可能延伸到豆瓣、小红书、抖音等其他平台,以比较和借鉴不同平台的算法应对经验。用户之间通过积极分享自身的使用经验和应对策略,彼此加深了对算法的认知、理解和反思,进而更可能主动采取行动建构算法身份。

二是用户与平台之间的官方渠道讨论。B站在社区中心开辟了用户意见和反馈讨论区,用户可以通过发布帖子向B站直接反馈意见以参与平台优化。例如,在#希望B站能增加或修改的功能建议话题中反馈“希望在首页推荐新增一个筛选视频时长的功能”、“希望可以在首页算法推荐中加入[我的收藏]视频”等。通过跟踪观察发现,虽然这种反馈效率低、周期长,但其中很多合理化的反馈意见的确得到了平台的改进和解决,用户的积极建言献策对B站平台建设以及算法优化能够产生一定影响。

进一步通过访谈发现,相比于弃用B站,大部分受访者还是更愿意共同改造B站:“B站是我家,改造靠大家。”(M9)究其原因在于,B站青年主要是基于共同的兴趣爱好而聚集在一起的趣缘群体,情感是维持其身份认同的纽带。B站包容、多元的文化环境使其产生了较强的认同感和归属感,进而形成主人翁意识,将B站当做个人的兴趣“家园”和网络“自留地”。对于B站青年来说,关闭或扰乱算法就意味着兴趣空间的“变质”,弃用平台则意味着彻底失去这片网络自留地:“也想过不用了,但有很深感情了不舍得,还是希望小破站越来越好”(M2),“我也试过关闭个性化推荐,但那样B站就变得很没意思”(F1)。因此,B站青年更愿意顺应和利用算法,或者积极影响和改变算法,从而打造符合想象和期望的算法身份。

总体而言,无论是算法修辞、算法“失灵”后的身份纠偏,还是社区讨论中的平台改造尝试,都表明B站青年在算法意识驱动下可以采取一定行动“有意识”地建构算法身份。研究者将这种主动策略总结为“顺从但不屈从”,即遵循算法但不听任算法的摆布,而是通过利用算法或影响算法的方式来达到主动建构算法身份的目的。当B站青年具备对算法的基本感知能力,就可能察觉到平台干预下形成的算法身份与自我想象之间的偏差,为其“有意识”地建构算法身份奠定了基础;当B站青年形成了有关算法运作逻辑的理解,就会对影响算法身份的各种因素具备关键的洞察力,为其“有意识”地利用算法提供了可行性;当B站青年提升对于算法的反思能力,就可以评估所接触内容的质量优劣并做出理性判断,为其“有意识”地影响和改变算法创造了可能性。

五、结论与讨论

本研究将身份建构问题置于智能媒体环境中,以B站用户为例对青年群体的算法身份建构加以考察。本研究首先从人与算法互动的视角对算法身份的内涵进行一定补充,将算法身份定义为:“算法基于用户被动或主动提供的数据推断其身份特征,同时用户依据算法规则凸显、纠正和改变身份特征,在此双向过程中建构起来的交叉重组身份”。算法身份不仅是算法按照分类逻辑而赋予用户的一种身份,也是用户可以通过意识觉醒而主动形塑的一种身份,同样具有“自我-他者”互动属性。

研究发现,长期沉浸在算法环境中的B站青年能够一定程度上感知算法存在和理解算法逻辑,并进一步形成算法身份想象,其作为前置条件对算法身份建构行为产生影响。一方面,B站青年的算法意识觉醒仍不彻底,致使其“无意识”地顺应平台规则,被动参与算法身份的建构过程,包括算法框架下的“自我标签化”、交互引导下的自我兴趣披露以及弹幕机制下的互动“狂欢”等。另一方面,B站青年已具备的算法意识又使其采取“顺从但不屈从”策略,通过算法修辞、算法“失灵”后的身份纠偏,以及社区讨论中的平台改造等方式主动建构算法身份。总体而言,B站青年的算法身份建构游移于“无意识”和“有意识”之间。即使受到平台的隐性控制,但B站青年在算法身份建构中的能动性仍然值得肯定,更深层次的算法意识觉醒也由此显得弥足珍贵。

本研究将B站青年的算法身份建构特征总结为三点:

一是“后台化”特征。相比于在微信、微博等社交媒体上公开的前台身份表演,青年群体在B站中建构的算法身份更多是呈现给自己和“同好”的后台身份。B站青年将平台视为一种私人空间或安全空间,从而袒露真实的个人爱好、品位等,实质上形成了一个“数字后台”。在这一区域中,B站青年通过算法修辞等暗号构成了群体间身份确认的话语边界,利用算法规则搭建意义共通的身份表达空间。与此同时,B站青年后台化的身份建构也暗含了对算法平台的“默认信任”(Walker,2006),这种算法信任的产生可能为人机交互研究拓宽一些新的思路。

二是“动态性”特征。无论是“无意识”的身份披露还是“有意识”的身份调整,B站青年的算法身份特征无时无刻不在累积、更新和转换。某种意义上,B站青年的动态算法身份建构追求的是一种对真实自我的挖掘和探索,暗含其中的是“让算法更懂我”的目标期望。算法通过挖掘数据为B站青年赋予各种身份类属,与此同时,B站青年也在不断认识算法中感知算法身份,并与想象和期望中的真实自我不断比照,通过多元表征手段应对两者之间的偏离。在这种动态过程中,算法身份和真实自我之间的靠拢和弥合由此成为可能。

三是“改良型”特征。在算法身份建构过程中,B站青年更倾向于顺从但不屈从算法、改造而非弃用平台。当陷入算法“失灵”时,B站青年能够利用算法规则进行算法身份的纠偏和调整,还可以通过社区讨论交换经验和建言献策,以积极应对算法甚至改造平台。这种群策群力的柔性改良不失为一种强积极性和群体智慧的体现,与既有研究中较为常见的“服从算法”和“抵抗算法”均有所不同,在人机互动链条中补充了“改良算法”一环,呈现出人与算法自在自如相处的新的可能性。

本研究仍存在一定的局限与不足:研究中有个别受访者面对算法身份相关问题时表现出回避、抵触等负面情绪,未来研究中可以进一步扩大样本,关注青年群体在算法身份认同中的复杂心态以及更加多元的行动可能性。

(洪杰文 常静宜:《“有意” “无意”之间:B 站青年的算法身份建构研究》,2023年第12期,微信发布系节选,学术引用请务必参考原文)