导读
本文通过介绍虚拟数字人的定义以及其在传媒行业中的应用现状,进一步深入讨论面临的机遇与挑战,为理解虚拟数字人在传媒行业应用和未来发展方向提供新的视角。
一、引言
随着人工智能技术被广泛应用于不同的领域,这一新技术的出现也催生了传媒业的变革。[1]技术媒体融合化已然成为媒体发展的新趋势,而人工智能技术的应用和影响也引发了学术界和工业界的广泛关注和讨论,并成为传媒研究领域的热点议题。在技术不断成熟和迭代的过程中,人工智能慢慢地被应用于互联网和新媒体领域的方方面面,从信息采集、加工和处理,到内容的生成、编辑和分发,再到内容的呈现、推送和用户互动。[2]人工智能技术改变了内容的生成和传播方式,全面赋能传媒行业产业链的各个环节,对整个传媒行业的生态产生了深刻影响。虽然内容生产和传播方式的改变带来了一定的积极影响,但是其对内容平等性和生产功利性的影响同样需要反思。[3]其中,虚拟数字人作为人工智能领域备受关注且最具有潜力的热门应用之一,近年来逐渐崭露头角。虚拟数字人的智能程度还在不断提升,未来与人类的合作如何分工、在传媒产业链中未来的定位是什么、将来朝着什么方向发展,都成为传媒业走向智能化过程中面临的问题。只有深入了解技术带来的利弊,才能更好地应用技术赋能传媒行业的发展和深度变革。
二、虚拟数字人概述
近年来,人工智能技术的进步加快了科技与媒体的融合发展,推动着传媒业向全面智能化发展。人工智能技术不仅重塑了整个传媒业的业态面貌,也在微观上改变了传媒产业的业务链。[4]虚拟数字人把这次变革推向了新的高度,改变了用户的认知、情感和行为反应,更深入地影响了他们的生活方式和价值观。虚拟数字人不仅具备虚拟形象,且其本质在于依托人工智能技术构建。一个被广泛认可的人工智能定义是机器模仿人类智力行为的能力,[5]尤其是机器模仿人类思维和认知的能力,例如学习能力和问题解决能力。[6]虚拟数字人不仅具有人工智能模仿人类智能的能力,还有类似于人类的外貌。它被认为是以人类样貌、心理和智力等元素为设计底本,借助信息技术创造出的虚拟人物形态,不管是有具体外貌还是仅通过语音或者文字交流,只要它具有特定的类人的功能,就能被归入该范畴。[7]因此,本文对于虚拟数字人的定义是,拥有模仿人类智力行为能力并且拥有语音或者文字沟通能力的机器,无论是否具有类人外貌。虚拟数字人的种类也多种多样,如果按照驱动方式来分类,则分为功能型虚拟数字人和身份型虚拟数字人[8]。按驱动方式分,可分为人工智能算法驱动虚拟数字人和真人驱动虚拟数字人。伴随着人工智能技术和计算机图像学的发展,虚拟数字人外貌形象已经从没有具体外表特征,发展到以动漫形象呈现,再到模仿名人外貌,现在已经可以生成具有极高仿真度的虚拟形象。人工智能拥有可以超越人类智力的能力,因其可以通过大数据和深度学习来预测模式、趋势和目的,这是人类大脑做不到的。[9]
三、虚拟数字人在传媒业的应用
人工智能与传媒业的融合推动了行业走向全面智能化,“人工智能+媒体”是未来传媒业发展的趋势。人工智能技术的应用推动了传媒技术从数字域到智能域的升级,从而向全面智能化的方向发展。[10]虚拟数字人则被认为是人工智能领域的热门应用之一和全球数字经济的新风口[11],值得我们更多地关注。目前该技术已经进入传媒产业的信息采集、内容生产、内容呈现、用户反馈等传媒产业链的各个生产流程和环节。虚拟数字人在传媒行业的具体应用有虚拟主持人、虚拟主播、虚拟网红、机器写作助手和虚拟客服等。
(一)写作机器人和生成式人工智能赋能信息收集、内容生产和编辑环节
2015年,腾讯研发出自动新闻写作机器人“Dreamwriter”,可以快速自动生成稿件并将信息送达用户。自此,写作机器人越来越多地走进新闻与传媒领域。例如,新华社的“快笔小新”、第一财经的“DT稿王”等,这些写作机器人更是集数据采集、数据分析、稿件生成、编发于一体,美中不足的是这类写作机器人是模板式算法新闻写作,只能机械地完成工作。
2022年,由OpenAI公司研发的ChatGPT为机器内容生成带来了新的生命力,它是一款基于大语言模型和生成式预训练转换模型,采用基于人类反馈的强化学习训练方式,以“对话+创作”为基础的生成式人工智能应用。通过人机交互的方式,实现提问与回答的迭代,逐步提升模型对生成答案的评判能力。在不断迭代的过程中,模型会不断优化,逐渐提高对问题的理解和生成更准确的答案。可以根据用户发出的指令实现信息检索和内容生成,而加强版的ChatGPT-4还可以处理和生成表格和图片信息。ChatGPT能够产出与人类常识、认知、需求、价值观等具有较高匹配度的文本,这也是ChatGPT的关键特征之一[12]。ChatGPT在与人类交流的过程中呈现出来的交互性、持续性、反馈优化性使其成为人机传播领域新的技术突破,也被认为是从弱人工智能向强人工智能发展的标志[13],为实现机器写作到人机协同写作提供了技术支持。
(二)虚拟主播和虚拟偶像丰富内容呈现、信息传播和人机交互方式
还有一种具有和人类相似的外表,但是没有实体形态的人工智能,例如:虚拟主持人、虚拟主播、虚拟偶像和虚拟网红等。技术赋予了这类虚拟数字人生动的形象和无限近似于人的外貌特征,在其进行人机交互的时候还可以传递眼神或者表情等多维度的感官信息。其中,虚拟网红和虚拟偶像作为拟人化的传播媒介已经在社交媒体上形成了新风尚,并成为新一代的意见领袖。[14]比如翎Ling作为国风虚拟KOL,不仅在商业领域中发挥重要作用,还积极弘扬中国传统文化。虚拟数字人新颖有趣,可以有效吸引观众的关注,并承担部分工作职能,从而减轻相关工作人员的负担并降低成本。并且这种虚拟形象的构建具有较高的可控性。然而,虚拟数字人的智能化和个性化程度还处于初级阶段[15]。当前,许多虚拟数字人尚不能达到智能化的高度,若要满足实时互动的需求,便需要强大的后台系统作为坚实的技术后盾,但构建这样的系统绝非易事。
四、虚拟数字人技术赋能传媒业变革
(一)解放生产力,提高生产效率
在内容审核方面,虚拟数字人的应用优化了审核流程,实现了更精准的内容推送。这为用户带来了新颖的体验,同时改变了内容制作者和消费者之间的互动方式。[16]从从业者角度看,有了人工智能技术的加持,信息采集、编辑、分发等流程的效率与质量产生质的飞跃。[17]传媒业中存在着许多简单重复、机械化、低创造性的工作,这些工作常常占用相关工作人员大量的时间,而虚拟数字人的出现把人们从这部分工作中解放出来,可以把更多的时间放在具有创造性的工作上。[18]比如,可以利用突发事件识别机器人进行实时的信息采集,再通过使用基于自然语言处理和生成模型的写作机器人来自动生产新闻或者内容,减少人工编辑的需求和工作量,而且因为虚拟数字人具有7×24全天候不间断工作的特点,可以有效提高应对突发事件的能力。这类技术的应用缩短了生产与流通时间,提高了劳动生产率[19],大大促进了生产力向更高、更先进质态演进,从而催生新质生产力。
(二)创新呈现方式,带来全新沉浸式交互体验
从用户的角度看,虚拟数字人凭借其学习能力强、失误率低、应用场景广和能实现虚实结合等特点被广泛应用于传媒领域,给受众带来全新的视听和交互体验。如,虚拟主持人和虚拟主播能够突破虚拟和物理空间的界限,实现虚拟形象与现实场景的无缝结合,为观众提供更加丰富的互动体验和沉浸式的感官盛宴。[20]在这种虚实结合场景和传播渗透下,更容易唤醒受众的情感共鸣和增强传播效果。[21]在当今这个信息爆炸的时代,尤其是年轻用户忠诚度普遍不高的背景下,虚拟数字人作为一种新颖的呈现方式,可以在前期吸引用户的关注,通过深度的人机交互和人机协作,在用户中建立情感共鸣和深层次的连接。
(三)促进产业链升级,加快媒体智能化发展
从行业的角度看,虚拟数字人已被应用于传媒全产业链,改变了内容生产和传播的方式,同时也带动了产业变革,推动着传媒业向全面智能化发展。此外,人工智能技术使内容生产具有了交互性, 也就是内容的生产者和消费者之间变成了交互关系, 不再是简单的线性关系。[22]信息收集和内容生产主体也从单一的个人转变为人机协同生产。[23]智能算法推荐系统被用于赋能信息分发流程,可以根据用户的行为,深入挖掘用户喜好和习惯,从而对内容进行优化。为用户推荐更加符合其兴趣的信息,提高信息传递的有效性。内容呈现的方式也变得多种多样,虚拟主播、虚拟偶像和虚拟客服的出现,改变了信息呈现的方式,给用户带来全新的体验。
五、虚拟数字人带来的挑战
(一)人工智能算法驱动型虚拟数字人引发信息真实性思考
生成式人工智能技术为新闻生产和传播带来了便利,但与此同时,人们越来越倾向于依赖技术带来的表面线索审视新闻,并没有深入思考信息的来源和真实性。[24]比如,ChatGPT因其强大的信息搜索和生产功能,而被广大群众熟知,但需要注意的是,它虽然具有较高准确度,但有时也会给出错误的回答或半真半假的答案。[25]有学者指出,通过ChatGPT重新组织句子和撰写文章也可能导致抄袭,且其容易用错误的或有偏见的信息误导研究者。[26]此外,有研究指出,消费者的隐私顾虑会对聊天机器人的接受度和使用意愿产生负面影响。[27]因为ChatGPT使用的是离线数据库,所以检索的内容不能做到与时俱进,生成的内容时效性较低。其次,数据库里的内容因为未经过筛选,可能会包含部分虚假信息,所以生成的信息还需要用户进一步甄别。
虚拟数字人对信息真实性的挑战有以下三个方面。第一,从数据来源来说,因为目前技术没办法识别搜集到的信息是否真实,所以在信息收集的过程中可能会接触到虚假信息从而被动地生成和传播虚假内容。第二,从算法角度来说,因为算法黑箱的存在,用户无法知悉其生成的算法和逻辑,导致信息真实性考证和监管比较困难。第三,从内容呈现方式层面说,信息呈现的主体从自然人变成虚拟数字人,虽然给大众带来了新奇的体验,但也可能引发算法偏见从而引发人们对于信息真实性的思考。
(二)生成式人工智能赋能虚拟数字人引发道德伦理问题
以ChatGPT为代表的生成式人工智能技术的兴起,为提高虚拟数字人的智能化水平提供了新的解决方案,促使虚拟数字人的发展迎来了新的增长。与此同时,泄露用户隐私、侵犯知识产权、数据滥用和视觉伦理等问题逐渐浮现,给虚拟数字人在传媒业的应用带来极大的挑战。例如,OpenAI新的应用文本-视频生成式模型Sora的出现可能会使真实与虚拟之间的界限更加模糊,导致深度伪造和虚假信息激增[28],引发视觉伦理和信息伦理的问题。ChatGPT在某些特定情境下可能缺乏道德立场,从而导致其回应可能不完全遵循道德准则,这种情况有可能对用户的道德判断产生影响。[29]虽然这类虚拟数字人给传媒业带来新的生产和传播模式,但也可能增加从业者失业的风险。再如,当智能算法推荐系统根据用户的偏好和习惯筛选并推送信息时,可能会产生“信息茧房”效应,使得用户接触到的信息变得单一和固化。这一系列问题的出现凸显了对虚拟数字人进行技术监管和制定道德规范的重要性和迫切性。
(三)高仿真高智能虚拟数字人引发“恐怖谷效应”
1970年,日本机械工程师兼机器人学家森政弘提出“恐怖谷效应”。他认为,当人工制造的实体逼真程度越来越高,观察者或者使用者会感到越来越舒适,直到达到非常逼真的程度。然而,当逼真度越过某个阈值,但又未达到完全真实的状态时,观察者或者使用者会感到强烈的不适和反感,形成了一个“谷”,这就是所谓的“恐怖谷”。[30]有研究表明,如果虚拟数字人拟人化水平达到一定程度,那么它的非人类特征会让人们产生异样的感觉,相比起拟人化程度较高的虚拟主持人,观众更喜欢那些不具有类人外表的虚拟形象。[31]虽然现在的人工智能技术远未达到真正的智能,但是ChatGPT的出现,似乎已经引发了“恐怖谷效应”并激发了人类的心理防御机制。[32]人类已经开始思考未来是否会被人工智能取代的问题。随着人工智能技术越来越成熟,虚拟数字人无限接近于人类智能,甚至可能超越人类。这已经不只是一个热点话题,而是关于生命体与智能化非生命体区隔的思考。其实,“恐怖谷效应”中还存在第二个拐点,即在经历“恐怖谷”之后,人们对于机器人的喜爱又会随着相似度的提升而增加。因此,如何从思想上和技术上跨越“恐怖谷”,真正达到人机共生,也是目前面临的挑战之一。[33]
六、对虚拟数字人未来发展的展望
随着虚拟数字人技术的不断进步,信息传播和交流的方式正在发生深刻变革。个性化商业和信息需求的涌现,推动了定制及个性化服务的快速发展。然而,这种变化也引发了一系列社会问题和道德挑战,亟待我们深入思考人工智能技术未来发展的方向。[34]从技术的角度出发,未来人工智能技术应该利用“多模态+大模型+基于人类反馈”的强化学习技术提升强智能性能[35]。但技术发展还需要结合意识形态和道德规范的建立,才能保证技术能朝着正确的方向发展。无论虚拟数字人未来如何发展,其发展宗旨应当着眼于更有效地辅助人类的工作而非取代人类。它应通过提升人类的工作效率、改善决策过程及优化操作流程,为创新生产方式铺路。人工智能应成为推动生产力进步的新动力,深化虚拟数字人在主流媒体的应用,推动主流媒体的深度改革,加快形成主流媒体的新质生产力。
(一)增强智能化和交互性
严格来说,目前的虚拟数字人还处于初级阶段,并没有实现真正意义上的人工智能。大部分虚拟数字人还是依靠算法预先编程和基于规则的系统,在特定情境中指导虚拟数字人的行为和反应,使其能够在设定的框架内模拟人类行为,通常无法真正理解环境或从经验中学习。然而要实现真正的人工智能,虚拟数字人需要有更先进的学习算法、更强大的计算能力以及更深层次的感知和理解能力。生成式人工智能的出现带来了契机,通过技术不断地迭代,从而达到真正意义上的智能化虚拟数字人和人机协同。这样不仅能把人类从机械重复的工作中解放出来,还可以辅助人类的初步决策,进一步解放生产力和提高生产效率。
尽管虚拟数字人技术取得了显著进展,但仍然存在一些缺陷。其中经常发生的问题之一是服务型的虚拟数字人未能及时理解用户意图,继而无法有效引导,导致用户满意度低,进而引发一系列回避行为。另外,不具有交互功能或者交互性较弱的虚拟数字人在应用初期能引起用户的好奇心和猎奇心理,但如果不能及时增强用户黏性或产生情感连接,用户很快就会流失。而从严格意识上来说,不具有交互性的虚拟数字人只是一种虚拟形象,不能被称为虚拟数字人。[36]因此,增强交互性和智能化至关重要,交互性和智能化水平的提高可以实现真正意义上的人机交互,与用户产生情感连接,从而提高用户黏性和参与度,真正跨越“恐怖谷”的临界点。
(二)提高道德伦理水平
虽然虚拟数字人的应用推动了传媒行业走向全面智能化,但是也带来了道德伦理问题。现有的道德标准并不适用于虚拟数字人,因此需要制定一套适用于虚拟数字人的道德伦理标准和算法,以解决现在面临和可能出现的道德和伦理问题。虚拟数字人本身没有知识产权意识和隐私意识,而且他们无法承担法律责任。随着虚拟数字人的不断发展和广泛应用,它也开始引发侵权纠纷,所以对其行为的道德伦理管控和治理需要提上日程。虚拟数字人的行为本质是由算法决定的,算法是由发明者编写的,但是如何使用技术是由用户决定的,所以如何界定责任追究问题也是至关重要的。首先,应提升对生成式内容自我管控和治理的能力和算法透明度,把责任落实到具体的个人。其次,应该从源头开始立法管控,制定适用于人工智能的法律体系。从技术层面和法律法规层面出发,提高虚拟数字人的道德伦理水平,是其未来健康发展的关键。
(三)成为传媒行业新质生产力
虚拟数字人应用于传媒行业的各个领域和各个部门,使劳动资料具备了新的属性,形成了新的生产方式。智能生产则是对传统的劳动资料进行智能化改造。例如,智能机器人、虚拟助理等都是智能化劳动资料。[37]未来,虚拟数字人的应用应该贯穿包含生产、分配、交换、消费在内的全过程,从而推动传媒行业生产力向更先进的质态演进。“新质生产力是以科技创新为主导、实现关键性技术突破而产生的生产力,是摆脱了传统增长路径、符合高质量发展要求的生产力。”[38]因此,虚拟数字人未来发展的重要方向应是利用人工智能技术推动传媒行业的深度变革,将从业人员从重复性的脑力和体力劳动中解放出来,从而提升全要素生产率并激发生产力实现质的飞跃。
【本文为国家社科基金重大项目“中国特色网络内容治理体系及监管模式研究”(批准号:18ZDA317)阶段性成果】
参考文献:
[1]赵蓓,张洪忠.2019年人工智能技术在中国传媒业的应用与思考[J].新闻与写作,2019(12):23-29.
[2]新华社“人工智能时代媒体变革与发展”课题组,庞晓华.人工智能在新闻传播全链条中的具体应用[J].中国记者,2020(02):19-22.
[3]谢新洲,韩天棋.基于数字技术的网络内容生产方式变迁研究[J].新闻爱好者,2023(08):14-20
[4]喻国明,兰美娜,李玮.智能化:未来传播模式创新的核心逻辑——兼论“人工智能+媒体”的基本运作范式[J].新闻与写作,2017(03):41-45.
[5]Shieber S, Rapaport W J. The Turing test: Verbal behavior as the hallmark of intelligence[J]. Computational Linguistics, 2005, 31(3):407-412.
[6]Syam N, Sharma A. Waiting for a sales renaissance in the fourth industrial revolution: Machine learning and artificial intelligence in sales research and practice[J]. Industrial marketing management, 2018,69: 135-146.
[7]简圣宇.“虚拟数字人”概念:内涵、前景及技术瓶颈[J].上海师范大学学报(哲学社会科学版),2023(04):45-57.
[8]席卿.虚拟数字人的发展和在媒体中的应用[J].中国记者,2023(11):123-124.
[9]Bock D E, Wolter J S, Ferrell O C. Artificial intelligence: disrupting what we know about services[J]. Journal of Services Marketing, 2020,34(3): 317-334.
[10]黄楚新,许可.人工智能技术驱动传媒业发展的三个维度[J].现代出版,2021(03):43-48.
[11]张菲菲.深度推进AI+媒体应用,打造智媒体——封面新闻的融合发展探索[J].青年记者,2019(18):23-25.
[12]喻国明,苏健威.生成式人工智能浪潮下的传播革命与媒介生态———从 ChatGPT 到全面智能化时代的未来[J]. 新疆师范大学学报 (哲学社会科学版),2023(05):81-90.
[13]王然,周彤彤,高宏雨. ChatGPT影响下的传媒生态:机遇、挑战与应对策略[J].青年记者,2023(11):53-56.
[14]刘德寰,姜文恒. 社会化媒体平台虚拟数字人用户感知探究[J].北京青年研究,2023(04):33-41.
[15]郭全中.虚拟数字人发展的现状、关键与未来[J].新闻与写作,2022(07):56-64
[16]杨扬, 张虹. 智能聊天机器人技术在出版业的创新应用及发展趋势[J].出版科学,2020(01):81.
[17]王仕勇,张成琳. 国内外ChatGPT研究综述及展望:人文社科视角[J]. 重庆工商大学学报(社会科学版),2023(05):1-14.
[18]高渊.新技术革命推动的传媒业变革研究——以生产力和生产关系的思想为视角[J].记者摇篮,2023(10):33-35.
[19]崔云.数字技术促进新质生产力发展探析[J].世界社会主义研究, 2023(12):97-109+120.
[20]李颖,王家琪.拓展与重塑:元宇宙背景下我国虚拟主持人发展前瞻[J].中国电视,2023(08):100-105.
[21]翁杨,杨大学.媒介元宇宙中的虚拟新闻主播:身份定义与话语功能[J].出版广角,2022(17):87-90.
[22]张洪忠,石韦颖,刘力铭.如何从技术逻辑认识人工智能对传媒业的影响[J].新闻界,2018(02):17-22.
[23]余君,程栋,张西静.十多年来中国传媒业人工智能应用研究知识图景演进[J].新闻爱好者,2023(02):56-59.
[24]胡宏超,谢新洲.人工智能背景下虚假新闻的发展趋势与治理问题[J].新闻爱好者,2023(10):9-15.
[25]史安斌, 刘勇亮.聊天机器人与新闻传播的全链条再造[J].青年记者, 2023(03):98-102.
[26]Salvagno M,Taccone F S,Gerli A G.Can artificial intelligence help for scientific writing?[J].Critical care,2023,27(1):1-5.
[27]Cheng Y, Jiang H. How do AI-driven chatbots impact user experience? Examining gratifications, perceived privacy risk, satisfaction, loyalty, and continued use[J]. Journal of Broadcasting & Electronic Media,2020,64(4): 592-614.
[28]方兴东,钟祥铭.谷登堡时刻:Sora背后信息传播的范式转变与变革逻辑[J/OL].现代出版:1-15[2024-03-19].http://kns.cnki.net/kcms/detail/11.5979.G2.20240312.1221.002.html.
[29]令小雄,王鼎民,袁健.ChatGPT爆火后关于科技伦理及学术伦理的冷思考[J].新疆师范大学学报(哲学社会科学版),2023(04):123-136.
[30] Mori M. Bukimi no tani [The uncanny valley][J]. Energy, 1970, 7:33.
[31]王怡.虚拟主持人在综艺节目中的功能与接受度研究[J].中国电视, 2023(01):94-101.
[32]黄荣,吕尚彬.ChatGPT:本体、影响及趋势[J].当代传播,2023(02):33-38+44.
[33]邢冬梅,赵艺涵.AI“恐怖谷”蕴含的主体性困境及其重塑[J].苏州大学学报(哲学社会科学版),2023(03):30-37.
[34]余君,程栋,张西静.十多年来中国传媒业人工智能应用研究知识图景演进[J].新闻爱好者,2023(02):56-59.
[35]郭全中,袁柏林.从GPT看AGI的本质突破:传媒业新挑战与未来[J].新闻爱好者,2023(04):30-35.
[36]颜卉.算法驱动型虚拟数字人涉侵权纠纷的规范解决路径[J/OL].重庆大学学报(社会科学版):1-14[2024-03-19].http://kns.cnki.net/kcms/detail/50.1023.C.20231018.1042.002.html.
[37]王水兴,刘勇.智能生产力:一种新质生产力[J].当代经济研究,2024(01):36-45.
[38]周文,叶蕾.新质生产力与数字经济[J/OL].浙江工商大学学报:1-11[2024-03-19].http://kns.cnki.net/kcms/detail/33.1337.C.20240301.1525.002.html.
(谢新洲:北京大学新媒体研究院院长、教授、博士生导师,本刊学术顾问;曾妮:北京大学新媒体研究院博士后、讲师)