坚定不移走中国特色社会主义法治道路
中国舆情法治网

   活动公告

谢新洲等:机遇与挑战:虚拟数字人在传媒业的应用和未来发展

来源:《青年记者》杂志 | 作者:杨松 | 发布时间: 2024-06-17 16:15:00 | 3680 次浏览 | 分享到:
2024-04-17 16:15 来源: 《青年记者》杂志

  导读

  本文通过介绍虚拟数字人的定义以及其在传媒行业中的应用现状,进一步深入讨论面临的机遇与挑战,为理解虚拟数字人在传媒行业应用和未来发展方向提供新的视角。

  一、引言

  随着人工智能技术被广泛应用于不同的领域,这一新技术的出现也催生了传媒业的变革。[1]技术媒体融合化已然成为媒体发展的新趋势,而人工智能技术的应用和影响也引发了学术界和工业界的广泛关注和讨论,并成为传媒研究领域的热点议题。在技术不断成熟和迭代的过程中,人工智能慢慢地被应用于互联网和新媒体领域的方方面面,从信息采集、加工和处理,到内容的生成、编辑和分发,再到内容的呈现、推送和用户互动。[2]人工智能技术改变了内容的生成和传播方式,全面赋能传媒行业产业链的各个环节,对整个传媒行业的生态产生了深刻影响。虽然内容生产和传播方式的改变带来了一定的积极影响,但是其对内容平等性和生产功利性的影响同样需要反思。[3]其中,虚拟数字人作为人工智能领域备受关注且最具有潜力的热门应用之一,近年来逐渐崭露头角。虚拟数字人的智能程度还在不断提升,未来与人类的合作如何分工、在传媒产业链中未来的定位是什么、将来朝着什么方向发展,都成为传媒业走向智能化过程中面临的问题。只有深入了解技术带来的利弊,才能更好地应用技术赋能传媒行业的发展和深度变革。

  二、虚拟数字人概述

  近年来,人工智能技术的进步加快了科技与媒体的融合发展,推动着传媒业向全面智能化发展。人工智能技术不仅重塑了整个传媒业的业态面貌,也在微观上改变了传媒产业的业务链。[4]虚拟数字人把这次变革推向了新的高度,改变了用户的认知、情感和行为反应,更深入地影响了他们的生活方式和价值观。虚拟数字人不仅具备虚拟形象,且其本质在于依托人工智能技术构建。一个被广泛认可的人工智能定义是机器模仿人类智力行为的能力,[5]尤其是机器模仿人类思维和认知的能力,例如学习能力和问题解决能力。[6]虚拟数字人不仅具有人工智能模仿人类智能的能力,还有类似于人类的外貌。它被认为是以人类样貌、心理和智力等元素为设计底本,借助信息技术创造出的虚拟人物形态,不管是有具体外貌还是仅通过语音或者文字交流,只要它具有特定的类人的功能,就能被归入该范畴。[7]因此,本文对于虚拟数字人的定义是,拥有模仿人类智力行为能力并且拥有语音或者文字沟通能力的机器,无论是否具有类人外貌。虚拟数字人的种类也多种多样,如果按照驱动方式来分类,则分为功能型虚拟数字人和身份型虚拟数字人[8]。按驱动方式分,可分为人工智能算法驱动虚拟数字人和真人驱动虚拟数字人。伴随着人工智能技术和计算机图像学的发展,虚拟数字人外貌形象已经从没有具体外表特征,发展到以动漫形象呈现,再到模仿名人外貌,现在已经可以生成具有极高仿真度的虚拟形象。人工智能拥有可以超越人类智力的能力,因其可以通过大数据和深度学习来预测模式、趋势和目的,这是人类大脑做不到的。[9]

  三、虚拟数字人在传媒业的应用

  人工智能与传媒业的融合推动了行业走向全面智能化,“人工智能+媒体”是未来传媒业发展的趋势。人工智能技术的应用推动了传媒技术从数字域到智能域的升级,从而向全面智能化的方向发展。[10]虚拟数字人则被认为是人工智能领域的热门应用之一和全球数字经济的新风口[11],值得我们更多地关注。目前该技术已经进入传媒产业的信息采集、内容生产、内容呈现、用户反馈等传媒产业链的各个生产流程和环节。虚拟数字人在传媒行业的具体应用有虚拟主持人、虚拟主播、虚拟网红、机器写作助手和虚拟客服等。

  (一)写作机器人和生成式人工智能赋能信息收集、内容生产和编辑环节

  2015年,腾讯研发出自动新闻写作机器人“Dreamwriter”,可以快速自动生成稿件并将信息送达用户。自此,写作机器人越来越多地走进新闻与传媒领域。例如,新华社的“快笔小新”、第一财经的“DT稿王”等,这些写作机器人更是集数据采集、数据分析、稿件生成、编发于一体,美中不足的是这类写作机器人是模板式算法新闻写作,只能机械地完成工作。

  2022年,由OpenAI公司研发的ChatGPT为机器内容生成带来了新的生命力,它是一款基于大语言模型和生成式预训练转换模型,采用基于人类反馈的强化学习训练方式,以“对话+创作”为基础的生成式人工智能应用。通过人机交互的方式,实现提问与回答的迭代,逐步提升模型对生成答案的评判能力。在不断迭代的过程中,模型会不断优化,逐渐提高对问题的理解和生成更准确的答案。可以根据用户发出的指令实现信息检索和内容生成,而加强版的ChatGPT-4还可以处理和生成表格和图片信息。ChatGPT能够产出与人类常识、认知、需求、价值观等具有较高匹配度的文本,这也是ChatGPT的关键特征之一[12]。ChatGPT在与人类交流的过程中呈现出来的交互性、持续性、反馈优化性使其成为人机传播领域新的技术突破,也被认为是从弱人工智能向强人工智能发展的标志[13],为实现机器写作到人机协同写作提供了技术支持。

   媒体公信

责任编辑:杨松