第一部分 中国数字人文发展鸟瞰

技术与政策:中国数字人文发展的外部条件环视

刘越男(中国人民大学信息资源管理学院)

李少建(中国人民大学信息资源管理学院)

余敏(中国人民大学信息资源管理学院)

引言

得益于数字技术在科学领域的广泛应用,数字人文(Digital Humanities)应运而生,掀起了人文领域的“数字转向”。追溯历史,学界多以1949年意大利神父罗伯特·布萨(Roberto Busa)利用IBM计算机编制电子索引为肇始标志,这一时期计算机开始作为一种新的工具应用到人文领域来解决问题[1],因此这种范式也称“人文计算”(Humanities Computing)。2009年,武汉大学王晓光教授发表名为《“数字人文”的产生、发展与前沿》[2]的论文,此文成为中国第一篇有据可查且被广泛接受的“数字人文”主题文章。同年,台湾大学举办第一届“数位典藏与数位人文”研讨会,提出将数字人文与数位典藏放在同样重要的位置。可以说自此以后,数字人文作为一个舶来概念正式进入中国学界,并在十几年间成为热议的论题[3]。尤其在2011年之后,越来越多以“数字人文”为主题的论文出现在学术期刊上,越来越多的数字人文研究项目兴起发展,信息资源管理、历史、考古、文学、语言、文化遗产、地理、艺术等众多学科的研究者踏入数字人文浪潮,站在新的时代方位上审视数字技术与人文研究的关系及其带来的影响,利用数字方法和工具来重新考察传统人文学科的既有课题,并为人文研究提供新视角甚至产生新的研究范式[4]。同时,越来越多的数字人文研究机构成立,成为数字人文研究的前沿阵地。此外,为汇聚群智,扩大数字人文影响力,有关高校、研究机构举办各类数字人文会议、研讨会和工作坊,清华大学、中国人民大学和台湾数位人文学会还分别推出了《数字人文》《数字人文研究》和《数位典藏与数位人文》等领域集刊或期刊。随着研究的不断推进,数字人文学科发展和人才教育需求渐趋凸显。2019年,中国人民大学设置数字人文本科荣誉辅修学位项目;2020年,率先建立全国首个数字人文硕士专业,并于两年后设置数字人文博士点。2023年,内蒙古师范大学设立全国首个数字人文本科专业。数字人文的发展已经蔚然成风,而其风之繁盛离不开数字技术和国家政策双轮驱动。

数字人文之所以可以区别于传统的人文研究,主要是有了更多的学科交叉和更多的数字技术的引入[5]。先进数字技术的应用为数字人文发展提供了基础支撑。数字化工具、大数据处理技术、人工智能、虚拟现实等技术的不断发展,使得人们能够更有效地处理和分析文本、图像、音频、视频等多元异构的文化资料。计算能力和存储空间的不断提升,使得计算系统突破了原有算力可以处理更大规模的数据集,帮助人们开展更复杂、更深入的人文研究。开放数据和开放源代码的推动使得人们能够更方便地获取和共享数据,促进资源的重新整合、利用和开发。这些技术手段丰富了人文学科研究的数据来源,使得人文研究既有问题有了新的解决路径,又提供了传统研究者可能发现不了的新问题、新知识、新脉络。由此形成了跨学科、跨专业、跨方法、跨技术、跨媒介、跨团队和跨问题意识组成的数字人文“大帐篷”。

国家政策在数字人文发展中起着全方位的作用,如通过制定专项资金支持计划为数字人文领域提供资金支持,包括研究项目、数字化工程等方面的资金投入,促进数字人文项目的实施落地;或在科技政策中对数字技术的研发和创新提供支持,推动数字人文领域的技术创新;又或是通过教育政策支持数字人文领域人才培养,支持数字人文研究中心建设等措施,培养具备数字技术和人文学科知识的综合型人才等。政策既指导着数字人文的实践问题,又引领着数字人文的发展方向。

技术与政策两者相辅相成,共同推动数字人文领域的进步。了解数字领域内正在发生的技术创新和政策变革有利于把握当下,眺望未来。因此,本报告以透析中国数字人文发展外部条件为目的,综合使用多种研究方法,回顾中国数字人文发展的技术和政策环境,并在此基础上立足外部条件视角,总结和阐述中国数字人文技术发展和政策支撑的趋势、问题和建议,为数字人文的可持续发展提供科学指导和支撑。

一、数据来源和研究方法

(一)技术部分

数字技术日新月异的动态更迭深刻影响着数字人文的视阈拓展和边界延伸,全面回顾当前中国数字人文技术应用情状有助于摸清家底、把握未来发展。

本小节的数据来源:一是学术期刊论文。主要包括:为控制学术论文的质量,以“主题=数字人文”为检索条件,以CSSCI和北大核心为期刊来源类别限制,在中国知网(CNKI)数据库进行文献调查,截至2023年6月30日,共得到相关期刊文献1,400篇。二是数字人文实践项目。主要包括:(1)2020—2022年中国数字人文大会历届获奖项目;(2)文化遗产数字重建项目;(3)《中国文化遗产数字化研究报告》(2022)“探元计划”案例项目;(4)2016—2022年上海图书馆开放数据竞赛历年获奖项目;(5)国内各大学或研究机构特色资源建设中的数字人文项目[6]。截至2023年6月30日,去除重复项目后共得150个数字人文项目。

本小节的主要研究方法:一是文献计量和人工精读。主要用于分析以“数字人文”为主题的期刊论文。首先运用文献计量和可视化工具CiteSpace、VOSviewer等对文献进行统计和可视化分析。从中国知网中将文献数据按照RefWorks格式导出并使用转换工具将其处理成WOS格式,方便后续导入和分析。其次,近年数字人文主题相关文献发表呈猛增态势(图1),因此本节对近3年发表的745篇论文进行人工阅读,结合可视化分析结果明确数字人文研究关注的主题和关键词,在此基础上进一步剖析数字人文研究中的技术应用情况。二是网络调研和数据可视化。通过网络从文化遗产数字化官方网站(如“数字敦煌”“云游故宫”等)、腾讯研究院微信公众号、上海图书馆开放数据竞赛网站、中国知网等渠道获取项目名称、项目团队、主要技术应用等相关信息,绘制中国数字人文项目主要技术应用列表,在数据收集的基础上使用Python编程对数字人文项目的应用技术进行词频统计和词云图绘制。

图1 数字人文主题发文年度分布

(二)政策部分

目前我国文化领域的引导性政策陆续出台,对数字人文领域的发展具有重要的推动作用,可促进数字人文领域的规范化、创新化和可持续发展。

为尽可能全面获取相关政策文本,本报告采用多种检索策略:首先,在国务院及其各部门的门户网站查找相关文件;其次,选择“北大法宝”政策法规数据库,利用检索词“数据”“数字”“文化”“文化遗产”“产业”“教育”等进行组配检索;最后,利用搜索引擎进行检索。为使样本更具有针对性,本研究在保证完整性的前提下缩小了样本范围,将政策规定的层级限定为国家级,同时将政策规定宽泛、不具体和内容极少的样本进行二次过滤,最终确定57个政策文本作为分析的样本。使用NVivo 14软件对这些样本政策文本进行结构编码,把握政策内容偏向。

表1 政策文件部分样本信息

二、中国数字人文技术环境的现状

(一)技术环境概述

数字技术是一个广泛的概念,通常情况下可以被界定为涉及数字信息处理、存储、传输和应用的技术,这些技术包括硬件和软件,用于执行计算、通信、数据分析和控制、数字呈现等各种任务。数字技术的发轫可以追溯到古埃及、美索不达米亚和古印度等文明出现的各种计数系统。然而,数字技术的腾飞式发展主要集中在近几个世纪。20世纪上半叶,第一台电子计算机问世掀起世纪革新,计算机性能、应用范围迭代扩展之路开启,尤其集成电路的发展使得计算机运算速度大幅提升、存储容量大大增加。至20世纪下半叶,微处理器的出现使得计算机变得更加小型和实用,个人计算机的普及转变了个人和办公室的工作方式,紧随其后万维网的发明使得互联网成为大众媒体和商业平台,进而彻底重塑了全球信息传递的方式。20世纪末至21世纪初,数字音乐、数字电视和数字摄像机等数字媒体的兴起为媒体传播和娱乐行业带来了深刻的变革,移动互联网技术的出现推动了智能手机的普及,进一步影响了人们的生活方式。此后,数字技术的处理能力进入爆炸增长期,摩尔定律促使计算机性能指数级增长,大数据、云计算技术使得大规模数据的计算、存储和分析变得更加容易,机器学习、自然语言处理等一系列人工智能技术的崭露为数字技术多个方面提供了增强、加速和创新的机遇,物联网技术、区块链技术的蓬勃兴盛更是在数据安全性、可用性和高效率性方面产生了强大的协同效应。可见,数字技术涵盖了以数字信息为基础的广泛技术领域,并在动态演化中推动着整个社会的数字化转型和变革。数字人文是变革中浓墨重彩的一笔。当技术的波澜泛及人文,便催生出人文学科向外延伸的新触角,形成“数字”与传统人文学科思想交融碰撞的新局面。在计算机、网络、多媒体和人工智能等数字技术的集成支持下,人文研究的范式、方法发生颠覆式变化,人文知识的获取、分析、集成和展示充满数字化理念,人文资料组织、标引、检索和利用过程贯穿使用数字化工具[7]。可以说数字人文技术应用引发数字人文研究实践,进而触发理论的建构,描绘出一个具有独特专业实践、研究方法和理论价值的多元领域。因此,在新技术不断涌现的背景下,把握数字人文发展的整体技术环境,梳理数字人文技术应用体系对数字人文的未来建设来说十分必要。

图2 数字技术9大分类示意图

数字技术可从不同视角进行分类,2023年9月,国家知识产权局发布《关键数字技术专利分类体系(2023)》通知[8],本报告在该体系基础上结合数字技术的用途分类重新梳理数字技术的分类范围及所涉具体技术(见图2),以环顾数字人文发展的全技术条件,包括人工智能技术、高端芯片技术、量子信息技术、物联网技术、数字媒体技术、工业互联网技术、元宇宙技术、区块链技术、数据管理和分析技术9大类和下级技术分支。

(二)数据收集结果分析

1.学术期刊论文关键词共现网络和可视化分析

文献关键词是文献的知识信息标签,是对文献全文内容的提炼和概括[9]。关键词频次可以反映领域研究热点及其演变,有助于把握学科发展现状。本节报告使用CiteSpace对期刊论文关键词进行频次统计,并按照关键词出现次数进行排名,排名前45的关键词有数字人文、图书馆、知识图谱、数字学术、可视化、图书馆学、关联数据、人工智能、大数据、人文计算、档案学、文化遗产、知识服务、本体等,如表2所示。

表2 出现频次排名前45的关键词

这些高频关键词是整个数字人文研究网络的重要节点。为更快速深入地掌握数字人文研究的整体现状,本节报告使用VOSviewer进行关键词聚类分析,VOSviewer主要依据文献Title(标题)、Keywords(关键词)、Abstract(摘要)进行共现(Co-occurance)分析。本节报告主要展现VOSviewer提供的Network Visualization(聚类视图)、Density Visualization(密度视图)。在关键词聚类视图中(如图3所示),圆圈和标签组成一个节点,元素大小取决于节点的度、连线强度、被引量等,节点颜色代表其所属聚类,不同颜色表示不同聚类,通过该视图可以查看每个单独聚类,发现数字人文研究热点的结构分布,如数字人文聚类人文研究、知识服务、资源整合、数据挖掘、知识发现、数据库等内容;深度学习聚类命名实体识别、SikuBERT、BERT、知识库、预训练模型等内容;可视化聚类古籍数字化、数字化、文本挖掘、地理信息系统、GIS、信息化、语料库、远读等内容;关联数据聚类知识组织、知识图谱、本体、元数据、IIIF等内容;人工智能聚类ChatGPT、知识图谱、关联数据、本体、智慧图书馆等内容。在关键词密度视图中(如图4所示),密度大小依赖周围区域节点的数量以及这些节点的重要性,通过该视图可看到知识图谱、大数据、文本挖掘、可视化、人工智能、关联数据等是数字人文研究的重要知识领域。

图3 关键词聚类视图

图4 关键词密度视图

2.数字人文实践项目技术应用分析

为全面把握数字人文领域的技术应用情况,本小节对从各渠道收集到的150个数字人文实践项目所使用的数字技术进行整理,利用jieba分词库和Python中的Counter函数和进行技术词组的词频统计(表3),并在此基础上使用词云生成库WordCloud绘制词云图,如图5所示。词云是一种对文本进行总结概括的可视化方法,其中的词汇大小由其在文本中的出现频率映射而来,直观地表达词汇的重要程度[10]。结合词频表和词云图可以清晰地看到,数字人文实践项目中数据库建设、网站开发、关联数据、3D建模、数据可视化、知识图谱、虚拟现实(VR)、人工智能、GIS、本体构建、动画制作、游戏开发、机器学习、社会网络分析、数字媒体等都是极为常用的数字技术。

表3 数字人文项目使用技术频次表

图5 数字人文项目技术名称词云图

(三)技术在中国数字人文领域的应用实践

图6 数字人文技术应用体系框架

无论是学术研究还是实践项目,数字技术在人文社科领域中的应用都渐趋广泛化、体系化。如数据库技术多用于数字人文基础设施建设;可视化技术多用于数据挖掘、文本分析、知识重组[11]等数字人文研究;VR/AR技术多用于打造具有交互体验[12]的数字人文应用场景;人工智能、机器学习技术多用于古籍数字化、自动标注和实体识别[13]等研究;3D建模、激光扫描技术多用于文化遗产的数字修复和虚拟重建。基于此,本小节参照前文总结的核心数字技术分类标准,结合数字人文数字技术应用现状,将这些数字人文常用技术归纳为结构化的数字人文技术应用体系框架(如图6所示),包括数据管理和分析技术、人工智能技术、数字媒体技术、元宇宙技术、物联网技术、区块链技术6大类。需要说明的是,这些技术之间并非严格相对独立,而是有可能互相交叉和渗透的,比如人工智能技术向多个领域渗透。

1.数据管理和分析技术应用

近年来,数据科学的迅猛发展已经为数据管理形成了一整套方法论体系,包括数据采集、数据清洗、数据组织、数据存储、数据备份和数据恢复、数据安全、国际图像互操作框架、大数据等。数据管理的第一步是采集数据(Data Collection),即通过扫描识别、网络爬虫、传感器、数据库查询、API(应用程序编程接口)等技术获取数据。数据清理(Data Cleaning)是数据管理中的关键技术,旨在识别和纠正数据中的错误、丢失、重复或不一致的信息,以提高数据的质量和可用性。数据组织(Data Organization)是指将数据以一定的结构和方式整理、分类、存储和管理的过程,有效的数据组织有助于提高数据的可访问性、可用性和利用价值,如语义网技术通过提供统一的语义标准,使数据更容易被机器理解,促进数据的互操作性和共享,关联数据则可以基于语义网原则,使用统一的标识符(通常是URL)来唯一标识资源,并使用RDF(Resource Description Framework)来描述资源之间的关系,实现全球范围内数据的链接。数据存储(Data Storage)技术旨在实现数据的持久保存,数字人文研究中常涉及的数据存储技术有关系型数据库[14]、图数据库[15]、NoSQL数据库等。数据安全技术(Data Security)是一组旨在保证数据安全性和可用性的方法和工具,包括数据备份和恢复、加密、访问限制等。数据科学可面向不同领域,从数据中提炼、挖掘价值。越来越多的图档博机构、大学科研机构开始以数据思维进行人文资料的数据采集、清洗、组织、存储和应用研究[16]

这一思维驱动下的数字人文研究主要有:(1)面向数字人文的档案资源整合[17],将馆藏档案资源以数据为原始单位进行组织和结构化解析,如近代商会档案数据资源整合[18]、中央苏区档案数据多元整合[19]等。(2)面向数字人文的图书馆资源建设,锻造馆藏资源数字长期保存、管理和揭示的能力,如高校图书馆特藏资源建设[20]、音乐图书馆音乐文献资源数字化建设[21]等。(3)面向数字人文的博物馆文化遗产数据资源开发,以数字人文新范式解决当前博物馆文化遗产组织存在的问题[22]。这些研究都离不开“资源/数据集合”,即专题数据库建设的核心特质和内涵。专题数据库是接合人文社群与技术脉络的界面,也是承载人文批判与技术转型的基石[23],尤其在数字人文实践项目中应用得十分广泛,据前文统计,运用专题数据库建设思路和相关技术的数字人文项目多达57个。而随着关联数据、资源描述框架(RDF)、本体构建、语义搜索等语义网技术的渐趋成熟,专题数据库已经开始从机构、资源导向转向“开放化”“计算化”“协同化”“智能化”[24]。例如上海图书馆建构的“中国家谱知识服务平台”,早在2014年,上海图书馆便开始了数字人文项目的纵深探索,力求将学科服务发展到数据服务[25]。该馆在家谱保存、研究和服务方面一直是国内行业翘楚,其馆藏家谱数量庞大、种类齐全、特色突出。因此,上海图书馆将家谱知识服务平台建设作为其数字人文实践探索的先锋,在提供文献检索服务的基础上充分引入以关联数据为代表的新型数据管理技术,重组图书馆传统资源,构建历史文献数据服务平台。该平台经过基于BIBFRAME的本体设计,从RDB到RDF的数据转换,基于关联数据四原则的系统设计和基于语义技术框架的系统开发,支持面向万维网的书目控制,提供针对普通用户的寻根搜索服务和针对专业人士的分面可视化、语义搜索乃至数据挖掘服务,推动数据开放和知识流动[26]。上海博物馆开发的“董其昌数字人文展示系统”[27]、中山大学图书馆开发的“徽州文书数字人文平台”也都积极运用了这些知识组织技术以形成资源的全方位整合和开发[28]。此外,国际图像互操作框架(IIIF)的发展也为图像资源的描述、分发和访问提供了一种前所未有的新方法,并很快被文化遗产部门广泛采纳。如李永卉等以镇江焦山碑林为例,基于Drupal内容管理平台进行关联数据应用与IIIF服务集成,实现了碑刻资源概念间关系的关联发布及可视化展示[29]。武汉大学数字人文研究中心、武汉大学文化遗产智能计算实验室基于IIIF、图像语义标注等推出了“文物数字图像关联数据聚合平台”。

数据分析技术涵盖了一系列的方法和工具,用于解析、转换、可视化或统计数据,从而提取有价值的信息以解决问题、支持决策、发现趋势。数字人文中的数字分析技术应用灵活多样,特色鲜明,常见的有数据挖掘、统计分析、人工智能(自然语言处理、机器学习等)、数据可视化、文本分析(词频、共现、关联关系)、社会网络分析、时序分析、GIS分析等。这一技术框架之下的数字人文研究主要集中在传统人文学科领域:(1)面向数字人文的文学和语言学研究,将量化方法运用于古代文学研究[30],利用社会网络分析工具对文学作品中的人物关系进行挖掘[31],将自然语言处理[32]、机器学习、深度学习等技术用于民间文学文本语料研究[33],将文本挖掘、GIS空间分析用于小说文本研究[34](2)面向数字人文的史学研究,主要是利用量化方法、聚类分析、社会网络分析、时空分析、GIS地图等对历史文本进行的挖掘和重新阐释,如范文洁等基于社会网络分析以《左传》的战争为研究对象进行计量及可视化研究[35],刘浏等以《春秋》三传中女性人物为研究对象从多维度对女性人文知识进行量化分析和可视化解读[36](3)面向数字人文的视觉艺术研究,包括电影可视化、绘画流派可视化、音乐可视化等研究,如中国电影知识体系下数字人文与影人年谱的可视化[37]、基于社会网络分析法的影人年谱研究[38]、TCPVis:基于谢赫六法的传统中国绘画画派可视分析[39]、音乐可视化设计中的映射探究[40]。在实践领域,数据分析技术主要集成于数字人文应用平台,这些平台除了提供海量规范化数据之外,还会提供大量的软件应用和统计分析工具,如由哈佛大学费正清中国研究中心、北京大学历史学系和台北“中研院”历史语言研究所合作建设的开放式关系型数据库“中国历代人物传记资料库”(CBDB),为用户提供了历史人物数据可视化查询功能,用户通过“引得”平台点击可视化查询即可多维度生成可视化图形,包括传主空间分布、词云、历代人物数量统计、生卒时间统计、历代人物生卒地分布、社会交往关系视图、亲属关系视图等。

2.人工智能技术应用

人工智能是指一类使机器能够执行通常需要人类智力参与的任务的计算机系统,具备包括学习、推理、问题解决、感知和语言理解等方面的能力。其目标是使计算机系统能够执行需要人类智慧和判断力的一些复杂任务,主要包括自然语言处理、机器学习、模式识别、智能语音、计算机视觉等技术分支。在数字人文领域,人工智能大有可为。

第一,自然语言处理、机器学习、深度学习等人工智能算法可用于文本处理、信息抽取、机器翻译等任务。研究人员可以利用这些技术分析海量历史数据,从大规模文本中提取有效信息,进一步发现关键概念、主题趋势和关系关联,如基于预训练语言模型的古籍文本智能补全研究[41]、基于SikuBERT预训练模型的古籍命名实体识别研究[42]、古籍自动标点研究[43]、古籍自动摘要研究[44]、词性自动标注研究[45]、古籍自动分词研究[46]等。

第二,知识图谱与自然语言、机器学习等技术相结合,可以进行智能文本分析、关系抽取和自动问答,为数字人文更便捷、深入地理解文本中的实体关系,挖掘隐藏在海量文献中的隐秘知识提供助力。例如数字人文视角下的领域知识图谱自动问答研究[47]、唐诗知识图谱的构建及其智能知识服务设计[48]

第三,模式识别、智能语音、计算机视觉等技术在文化遗产数字化保护和传播中应用广泛。模式识别技术可用于文物表面纹理、图像符号、色彩等的识别,助力文物鉴定、文物分类和文物研究等工作。智能语音技术常用于提供文化遗产场所的语音导览。游客可以通过移动应用或设备,听取关于展览品、历史场所等的语音解说,以更深入地了解文化历史和背景,如“泉州:宋元中国的世界海洋商贸中心”智慧语音讲解平台可结合观众线下使用场景,通过轻松自然的语气和多种语言切换,给各国观众营造一种现场陪伴式的讲述感。计算机视觉技术是指让计算机系统能够理解、解释和处理图像或视频信息的领域。它涉及利用计算机算法和模型来模拟人体视觉系统的能力,从而使计算机能够识别、分析和理解图像中的内容。因此多用于数字人文领域文物、历史照片的自动识别,如基于图像模态迁移与集成的中国陶瓷派系识别模型构建研究[49]。除此之外还可用于文本数据与图像数据的关联,如将博物馆中的文本描述与艺术品图像关联起来,为观众提供更完整的背景关联。另外,还能促进智能化、自动化的图像搜索。

3.数字媒体技术应用

数字媒体是一系列利用数字化技术(数字化信息处理和存储)来创作、编辑、传播和展示媒体内容的技术,包括文本、图像、音频、视频等形式的媒体。数字媒体技术的发展为数字人文领域带来了更广泛、更便捷的媒体形态和创作方式,也推动了数字人文研究成果的创新呈现和多样传播。

首先,数字人文领域资源的多元异构特征十分明显,图像处理、音频处理、视频处理等技术通常融合应用于数字人文的研究实践。由起承研究院建设的“中国非物质文化遗产基因数据库”、宁波诺丁汉大学宁诺数字人文研究组开发的“宁波城市历史数字人文信息化平台”、中国人民大学艺术学院等打造的“红色夏天 智能航宇”移动应用程序都综合应用了这些多媒体技术元素,为人文传播注入了高效性、丰富性和广泛性的色彩。

其次,据前文统计,网站开发、小程序开发、移动应用开发都是数字人文项目对外交流的常见窗口,其成熟的技术运用为数字人文资源、成果和产品的展示、共享和访问提供了更加便捷的方式。其中,小程序和移动应用为数字人文提供了移动平台,观众可以随时随地访问数字人文的数字资源和内容,还可通过API接口进行社交媒体的分享和互动。上海图书馆举办的开放数据竞赛中小程序和移动应用开发成果较多,如“民国百花”“原印鉴章”“丹红印记”“沪动”等,契合了移动互联网时代观众接受信息的习惯偏好。同时,网站也是数字人文成果呈现的重要平台。网站作为全球性的数字平台,可以让观众在世界范围内访问和共享数字人文资源和成果,有利于文化、历史和艺术的对外推广。且网站支持多媒体内容的展示,能够很好地承载丰富立体的数字人文资源和成果,如由中国人民大学数字记忆团队开发的“北京记忆”系列项目,采取“前站后库”的框架结构,构建以网站为主体,以其他社交媒体为辅助途径的北京记忆文化数字传播平台。

最后,游戏开发技术是一系列用于设计、创建和发布电子游戏的技术,其技术关键词包括游戏引擎、3D建模、动画制作、云游戏等。游戏作为“第九艺术”,已经进入数字人文研究的广域视野中,尤以文化遗产的3D重建及互动沉浸体验开发为最热。最著名且最成熟的当属腾讯游戏与敦煌研究院、故宫博物院、长城保护单位等开展的一系列文博合作,腾讯自主研发的云游戏技术、PCG(Procedural Content Generation,程序化内容生成)技术、游戏引擎等在其中表现优异。如由中国文物保护基金会携手腾讯打造的“云游长城”项目综合应用创新技术对修缮后的喜峰口长城进行实地扫描和数字重建,该项目是全球首次通过云游戏技术,实现最大规模文化遗产毫米级高精度、沉浸交互式的数字还原。第一,该项目团队通过照片扫描建模技术,实现了毫米级测量及对超过5万张海量素材的渲染,生成了超10亿面片的超拟真数字模型;第二,在处理多达10亿面片长城墙体扫描资产的基础上,在周围山体“种植”了超过20万棵树,可以“一镜到底”,看到非常完整的自然环境;第三,通过实时渲染和动态光照技术,让人们可以在其中移步换景,甚至感受早晨、中午、黄昏的美景变化;第四,通过云游戏传输流控算法,确保在手机等移动端,能将庞大的数字资产以3A级的观看效果和交互体验呈现给观众[50]。通过“云游长城”,观众可体验长城修缮,在线体验修缮长城时需要经历的考古清理、砌筑、勾缝、砖墙剔补和支护加固等流程;还可以在游览过程中,收获包括长城排水口的分布、礌石孔、破损敌台、射孔、箭窗、刻字砖和敌台入口等的知识点科普[51]。除了提供更具科技感和沉浸感的体验之外,“云游长城”还能通过趣味互动,让人们了解长城常识和修缮知识。例如,在“长城轻阅读”版块中,可以了解各种“长城之最”;在“长城·万里共婵娟”里,可以选择最适合赏月的长城段,搭配古诗词生成浪漫唯美的图片;“答题识长城”也很有意思,答题互动之后可以获得“小红花”,这些“小红花”能通过公益平台配捐的方式,助力到对应的文保项目之中,让用户的线上参与变成线下公益。

4.元宇宙技术应用

元宇宙是整合多种新技术而产生的新型虚实相融的互联网应用和社会形态,是基于扩展现实技术提供沉浸式体验,以及数字孪生技术生成现实世界的镜像[52]。元宇宙的搭建涉及感知交互设备、芯片算力、5G传输、人工智能、区块链、云技术、VR/AR、数字孪生等多领域硬件及软件核心技术及其应用。在数字人文领域,元宇宙的理念和技术融合尚处于初探期,但交互技术、3D重建、非同质化通证、人工智能、数字孪生等重要分支已稍露峥嵘,如虚拟数字人文、数字藏品、虚拟世界等应用已经开始了探索的脚步[53]。其中,虚拟现实(VR)和增强现实(AR)技术,是利用电脑模拟产生三维空间的虚拟世界,通过用户视觉、听觉、触觉等感官实时、直接观察或操控虚拟空间中的事物,能让用户具有身临其境的感觉。VR/AR技术集成了计算机图形、计算机仿真、人工智能、传感、显示及网络并行处理等技术,是数字人文技术中的高新技术[54]。据前文统计,应用VR技术的数字人文项目共18个,约占样本项目技术使用总量的4%(见表3),且大多数为文化遗产类数字人文项目。如“数字云冈”项目,在云冈石窟“数字档案”高清三维数据的支持下,云冈研究院打造了一套基于VR眼镜的多人在线沉浸式石窟体验系统,通过VR设备不仅可以使游客在虚拟场景中漫游,同时还能让游客欣赏石窟的高处以及在现场无法参观到的一些艺术之美[55]。随着技术的不断成熟,增强现实(AR)和混合现实(MR)技术也逐渐应用于文化遗产的数字展陈场景中,如由连偶(重庆)科技有限公司与三星堆博物馆合作推出的三星堆MR导览“古蜀幻地”项目,利用AR/MR技术以影视级的制作水准进行三星堆相关剧情策划和内容开发,通过现实展陈点位结合,为游客营造了场景内容丰富、视觉效果逼真的增强现实游览空间[56]

另外,数字孪生也是文化遗产数字化保护和传播的重要方向,一方面,数字孪生是3D重建、虚拟现实、增强现实、区块链等技术的集合产物,另一方面,数字孪生是元宇宙最坚固的底层架构之一。当前,数字孪生已经开始作为新一代数字模拟技术应用于传统文化遗产的数字化研究,如水下文物遗产数字孪生系统构建[57]、遗产桥梁数字孪生建造[58]、长城数字孪生建设[59]等,建模和仿真技术是数字孪生得以助力文化遗产数字保护、永续利用的核心关键。同时,综合性的文化遗产数字孪生平台也有所尝试,如故宫博物院与腾讯联合打造的“文化+科技”新型文物数据智慧化采集科研实体“故宫·腾讯联合创新实验室”于2023年5月18日正式落成。该实验室建立在故宫博物院数字与信息部摄影室基础上,应用了腾讯数字孪生、虚拟演播、云音视频创作等下一代互联网技术,加速文物数字资源采集、加工、展示的全流程智能化管理,助力故宫百万件文物的数字化采集与利用。实验室内共分布16处环境监测传感器,实时采集、传输环境数据给智慧管理平台,工作人员可实现对文物数字化空间的实时监控、实时调整。对于不同材质的文物,例如丝绢、陶瓷、青铜、玉石等,通过智慧平台设定适宜的温湿度,让它们在最安全稳定的空间里进行拍摄或三维扫描[60]

5.物联网技术应用

物联网技术是一种通过互联网连接和交互的方式,将各种物理设备、传感器、软件以及其他物体纳入一个定制网络中,实现数据的采集、传输、分析和应用的技术体系,多应用于工业、农业、零售业、智能交通、智慧城市等领域中。理想状态下,物联网技术能够促进数字人文研究和实践的智慧化、智能化和自动化,其所涉及的技术关键词有智能传感器、高精度定位、近距离无线通信、边缘计算、IPv6(互联网协议第6版)、数字孪生、终端安全和平台安全等。如智能传感器可以为数字人文研究提供实时的数据收集,结合遥感测绘获取地理实时数据,也可用于数字博物馆和展览的设计,通过在展品上集成传感器和标签,实现展品状态的实时监测,促进文物保护的高效性、智能性。相较于数字人文其他领域,文旅行业在与物联网技术的融合方面显得更加游刃有余,如高精度定位技术则可应用于博物馆、历史场所等区域的精准定位服务和虚拟导览。游客可以通过手机或其他设备获取实时导览、展品信息,并获得定制化的导览体验。另外,还延伸出了“智慧文旅”的概念,即以文化为内涵、以旅游为载体、以科技为动力,利用物联网、大数据、人工智能等多种信息技术,整合通信和信息资源,对文化旅游资源进行分析和挖掘,最终通过智慧文旅产品贯穿于用户全场景的旅游服务中[61]

6.区块链技术应用

区块链技术是一种分布式账本技术,它通过将数据存储在不同节点组成的网络上,每个节点存放相同的数据,这些数据由顺序相连的区块构成(即区块链),并使用加密算法保证数据的安全性和一致性。区块链采用去中心化的方式,每个参与者都有拷贝完整的账本,且通过协商算法保证各节点之间的数据同步。这种特性使得区块链在消除中间商的同时保障了数据的透明性和不可篡改。理想情况下,首先,区块链技术可以用于保护数字人文研究和实践所形成的多模态数字文化资产(数字艺术品、数字藏品、数字故事视频等),如秦始皇帝陵博物院对外发布的文创数字藏品“秦陵彩绘铜车马一号车”,中国人民大学数字人文研究中心发布的“冰嘻嘻”,中国国家博物馆推出的四羊青铜方尊、西汉错金银云纹青铜犀尊等4件国宝级文物的数字藏品。通过构建更加透明和高效的数字版权管理系统,数字人文成果的创作者可以通过区块链记录版权信息,实现更精准的版权保护和授权管理,维护其数字成果的权益。例如,陈燕琳提出基于区块链技术的公共图书馆古籍数字化版权保护策略[62]。其次,区块链技术还可应用于馆藏文物信息资源的共享[63]。最后,区块链技术还可以用于建立数字人文产品的交易平台。通过智能合约,实现交易和支付的自动化,保证交易的透明性和安全性,促进数字人文产品的市场转化。然而,区块链技术和元宇宙、物联网技术一样都属于数字人文领域技术增进的未来方向,与数字人文的深入交融还需要长足的努力。

三、中国数字人文政策环境的现状

(一)政策环境概述

国家政策的制定与实施,为数字人文的发展指引方向。近年来,党和国家高度重视中华传统文化复兴以及文化与信息技术的结合,尤其是“十三五”以来,政府制定了一系列指导性的方针和政策用以鼓励创新数字文化产品的转化和开发。如2016年11月的《“十三五”国家战略性新兴产业发展规划》[64],2017年1月《关于实施中华优秀传统文化传承发展工程的意见》[65],2020年11月的《文化和旅游部关于推动数字文化产业高质量发展的意见》[66]《新文科建设宣言》[67]以及2021年11月的《交叉学科设置与管理办法(试行)》[68],2022年5月《关于推进实施国家文化数字化战略的意见》[69]等,一系列规划文件促进了数字化技术和文化服务的深度融合、新文科建设与交叉学科的发展,文化数字化和中华文化全面复兴的推进,给数字人文的发展带来了优良的政策环境。

(二)政策文本量化分析

使用NVivo 14软件对样本政策文本进行结构编码,最终形成文化传承与弘扬、公共服务、基础设施建设、创新创业、产业发展、体制机制、人才培养、监督评价、法规标准、资金投入10个编码节点,如表4所示,参考点数量为该节点在所有政策文本中出现的次数,材料数量为出现该节点的不同材料数量。

表4 政策内容编码参考点与材料数量情况

续表4

1.政策编码内容词频统计

为整体了解数字人文相关政策的主要关注点,利用NVivo 14对已编码的政策文本进行词频统计,如表5所示,同时绘制词云图,如图7所示。

首先,在政策导向上,“文化”一词出现频次最高,共计3,059次,“发展”一词其次,共计2,509次,体现出当前数字人文相关政策以文化和发展为目标的特点。

其次,词频前十的关键词还有“数字”“服务”“技术”“数据”“资源”“公共”“信息”“创新”,分别共计2,378次、2,197次、1,383次、1,253次、1,202次、1,138次、1,100次、1,008次,词频均在1,000次以上,体现出国家政策导向通过技术创新、数字资源等方式和形式,提供公共服务、发展文化事业的基调。

表5 政策文本高频词统计

再次,在数字人文的具体应用场景上,“产业”988次,“古籍”868次,“网络”793次,“数字化”787次,“教育”658次,“企业”642次,“标准”608次,“经济”606次,“文物”433次,“出版”395次,“乡村”331次,“图书馆”318次,“学科”304次,“文化遗产”272次。整体主要体现出在企业、产业等经济发展方面,古籍数字化、学科教育、数字出版、乡村文化振兴、文化遗产保护、文物数字化保护等,这些都是数字人文推进文化数字化战略的切入点。

最后,在数字人文的具体要求上,“共享”490次,“信息化”459次,“互联网”431次,“科技”391次,“法规”370次,“知识”272次,整体体现出数字人文发展过程中对文化信息化、科技创新、法规标准、数据共享、知识互联等方面的具体要求。

图7 政策文本高频词云图

2.政策编码内容具体偏向

为深入探析数字人文相关政策内容的具体偏向,绘制政策内容编码分布图(图8),结合表4政策内容编码参考点与材料数量情况分析如下。

文化传承与弘扬、基础设施建设和公共服务是政策中三个互相关联的核心领域,可视其为数字人文对国家文化数字化推进作用的具体体现。基础设施建设是这三者之间的基础和桥梁。特别是数字化基础设施的建设,不仅是实现其他目标的基础,也是推动数字经济发展的关键。基础设施建设在政策文本中广泛出现,拥有926个参考点和52个相关材料,显示了其高频率和广泛的政策覆盖。在基础设施的支持下,文化传承与弘扬得到了加强。作为政策中编码数量最多的节点,它拥有1,166个参考点和42个材料。这反映了政策对保护和推广传统文化的明确导向。通过数字化基础设施,如智能算力、通用算法和开发平台,文化传承与弘扬能够更有效地进行。数字人文不仅促进了数据基础设施的建设,也提供了丰富的数据基础,激励了学术和社会研究,进而促进了传统文化的保护和发展。而公共服务作为另一个重要节点,与基础设施建设和文化传承发展紧密相连。公共服务领域拥有1,104个参考点和45个材料,显示了政策对提高社会服务效率和质量的重视。数字化升级在公共服务领域尤为重要,包括古籍数字化和提升数字文化资源的可获取性等措施。这些举措不仅提升了公共服务的质量,也反映了利用数字技术保护和发展传统文化的策略。基础设施建设为文化传承与弘扬提供了必要的技术支持和平台,而文化传承与弘扬又通过在公共服务领域的实施,使传统文化得以在更广泛的社会层面得到保护和推广。这三者形成了一个互相促进和依赖的关系网络,共同推动了国家文化数字化发展。

图8 政策编码节点分布

创新创业、产业发展和人才培养是数字人文的创新引擎与发展动力。首先,创新创业作为推动数字人文发展的关键因素,获得了显著的重视,其参考点数量达到682个,材料数量为39个,反映出政策对于利用数字技术推动文化创意产业创新的重视。这不仅包括文化内容的数字化,还涉及新兴领域如AR/VR技术等的发展。通过建立数字文化创意产业创新平台,政策鼓励这些技术的融合和应用,旨在形成新的经济增长点和就业机会,进而推动数字人文学科与商业化和技术创新的结合。其次,产业发展作为数字人文领域的核心组成部分,同样受到政策的高度重视,其参考点数量为602个,材料数量为30个。政策着重于文化产业的现代化和数字化转型,包括发展数字出版、在线表演艺术以及利用大数据和AI技术进行市场分析和用户画像,从而提升文化产品的市场适应性和吸引力。此外,共建共享文化产业数据管理服务体系的提议表明了政府对文化产业数据集中化管理和服务化的支持,这有助于营造一个健康、有序的数字文化市场环境。最后,人才培养是这一体系中不可或缺的组成部分,其参考点数量为217个,材料数量32个。政策不仅强调了为产业发展培养人才的重要性,更突出了人才培养在整个数字人文领域,乃至国家文化发展中的全面性和核心地位。政策支持通过高校和培训基地加强数字人文领域的人才培养和建设,这包括改革教育制度,将数字人文的方法和工具纳入传统人文学科的课程中,从而培养学生的跨学科思维能力和数字素养。这样的教育改革和人才培养政策不仅会改变人文学科的教学和研究方式,还将培养出更多的数字人文专家,对中国传统人文学科的现代化和数字化转型起到关键作用。

体制机制、监督评价、法规标准和资金投入作为数字人文领域的支撑体系,为数字人文的发展提供框架支持与良好的政策环境。首先,体制机制作为数字人文领域的基石,拥有299个参考点和31个材料,这体现了政策在改革文化数据管理体系方面的着力,其中包括建立数据共享平台、标准化数据格式和管理流程,以及促进政府、企业和学术机构之间的协作。体制机制的改革集中于数据共享、版权保护和数字文化市场的规范化,旨在为数字人文创新创造良好的政策和管理环境,强调文化数据管理的体制机制创新,包括推动数据技术产品和应用范式的更新。其次,监督评价拥有的参考点为187个,材料数量为21个,显示了政策对于监督数字人文项目的关注。加强监督评价可能意味着对数字项目的效果进行更严格的评估,以确保资源的有效利用,同时保障数据安全和隐私。这还包括对数字人文项目的质量和效果进行监督和评价,建立项目评估标准、实施定期审核和公众反馈机制,以确保项目的透明性和有效性。再次,法规标准拥有113个参考点和25个材料,表明政策对于建立清晰的操作框架和质量保证的倾向。制定相关法律法规和标准,旨在为数字人文领域提供清晰的操作框架和质量保证,这对于维护市场秩序和鼓励健康竞争至关重要。政策推动数据资源标准体系建设,这对于提升数据管理水平和数据质量具有重要作用,同时也强调了数据开放和产权保护的法规建设。最后,资金投入虽然相对其他节点而言参考点较少,仅有34个,但材料数量为18个,其重要性不容忽视。增加对数字人文项目的资金支持,尤其是在公共文化服务和高等教育领域,可以激发更多的创新活动和研究工作。资金扶持政策的出台对中国的数字人文项目至关重要,因为这些项目往往需要昂贵的软硬件支持。同时,优化的政策环境还将确保这些项目能在一个稳定和有利的法律及行政环境中运行。因此体制机制提供了管理的基础框架,监督评价确保了项目的有效性和透明性,法规标准维护了市场秩序和质量标准,而资金投入则为这些活动提供了必要的资源支持。这些方面的协调一致是实现数字人文领域成功发展的关键。

(三)政策特点分析

1.自顶向下:战略的制定与实施

当前各项相关政策的首要特点是将国家发展战略作为制定各项政策的根本导向,立足国家发展需要与当前实际进行研制规划。在国家文化数字化战略等背景下,国家和地方纷纷制定了与之配套的实施政策,来满足新时代国家发展需要、社会多元需求,同时也促进了数字人文的发展。以国家文化数字化战略为例,自2022年5月中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》以来,截至2023年底,福建、山西、江苏、宁夏、甘肃、广西、四川、山东、西藏、上海等地均出台了配套的地方文化数字化战略实施方案(详见表6)。为便于统计,仅收集了明确配套贯彻落实或推进国家文化数字化战略的省级地方政策文件,另各地亦有文旅、广电、文物等部门以推进国家文化数字化战略为目的出台相关政策。

表6 地方贯彻落实国家文化数字化战略情况

其中四川省委办公厅、省政府办公厅印发了《四川省推进国家文化数字化战略实施方案》[70],旨在贯彻落实党中央关于实施国家文化数字化战略的决策部署,更好发挥信息化牵引带动作用,加快建设数字四川和新时代文化强省。《西藏自治区关于推进实施国家文化数字化战略的实施方案》[71],要求全区各地各部门结合实际,认真贯彻落实数字西藏建设工作部署,不断满足人民日益增长的精神文化需要,推进社会主义文化强国建设。宁夏出台《关于贯彻落实国家文化数字化战略的实施方案》[72],以宁夏文化大数据体系建设为抓手,以深化文化领域供给侧结构性改革为主线,以满足人民日益增长的精神文化生活需要为根本目的,推进黄河文化传承彰显区建设,打造文化兴盛沃土,推动文化事业和文化产业高质量发展。文化数字化战略自顶向下地出台,以推进国家文化数字化,推动数字文化产业高质量发展,让文化数字化成果惠及更多人,政策制定体现出显著的服从国家大局、与时俱进等特性。

2.重中之重:传承与弘扬中华优秀传统文化

相关政策第二个显著特点在于强调将传承与发展中华优秀传统文化置于重要位置。政策制定注重传承和弘扬中华传统文化,以文化自信为支撑,通过政策推动文化产业发展,加强文化教育,以提升国家文化软实力,这与数字人文以人文研究问题为落脚点不谋而合,复兴中华文化亦是数字人文研究的重要任务。如2017年中共中央办公厅、国务院办公厅印发《关于实施中华优秀传统文化传承发展工程的意见》[73]提出“制定文化产业促进法、公共图书馆法等相关法律,对中华优秀传统文化传承发展有关工作作出制度性安排”,“到2025年,中华优秀传统文化传承发展体系基本形成,研究阐发、教育普及、保护传承、创新发展、传播交流等方面协同推进并取得重要成果,具有中国特色、中国风格、中国气派的文化产品更加丰富,文化自觉和文化自信显著增强,国家文化软实力的根基更为坚实,中华文化的国际影响力明显提升”。《中华人民共和国公共文化服务保障法》[74]第三章专门针对公共文化服务提供,其中提到要“促进优秀公共文化产品的提供和传播,支持优秀传统文化传承活动”。《中华人民共和国国民经济和社会发展第十三个五年规划纲要》[75]提出要“构建中华优秀传统文化传承体系”,包括各地出台的文化遗产保护条例、红色资源保护条例、民间传统文化保护条例、古籍保护政策等,无不将传承和保护中华优秀传统文化作为重要内容之一,实施中华优秀传统文化传承发展的相关工程,是建设社会主义文化强国的重大战略任务,对于传承中华文脉、全面提升人民群众文化素养、维护国家文化安全、增强国家文化软实力、推进国家治理体系和治理能力现代化,具有重要意义。例如古籍作为中华优秀传统文化的重要载体,其数字化工作也是数字人文研究参与国家文化数字化战略的重要一环,为构建中国特色信息资源管理自主知识体系奠定了坚实的文献资料基础。

3.有力抓手:数据基础设施建设

数字人文研究的资源类型十分广泛,包括红色文献资源、古诗词、先秦诸子典籍、儒学、史书、民国报纸、族谱、家谱档案、历史档案、少数民族档案文献遗产等[76],尤其在数字化时代,信息资源已经成为各个领域的核心要素,因此建设好数据基础设施成为当务之急。无论是国家文化数字化战略的实施,还是数字人文研究的开展,做好数据的采集都是重要前提。当前相关政策也体现出以数据基础设施建设作为政策重要抓手的特征。国家互联网信息办公室发布《数字中国建设发展报告(2017年)》指出要“推动建立完善数据基础性制度,加快推动构建统一高效、互联互通、安全可靠的国家数据资源体系”[77]。2020年11月,《文化和旅游部关于推动数字文化产业高质量发展的意见》提出要“建设数据中心、云平台等数字基础设施,完善文化产业‘云、网、端’基础设施,打通‘数字化采集—网络化传输—智能化计算’数字链条”[78]。2022年6月国务院《关于加强数字政府建设的指导意见》指出要“扩大数字基础设施覆盖范围,优化数字公共产品供给,加快消除区域间‘数字鸿沟’”[79]等。数据基础设施建设已经成为国家文化、经济等各项工作开展的重要前提和有力抓手。数据基础设施建设可以从数据的采集、加工、组织、展示、利用等几个角度入手,当前相关政策也都有所涵盖,如国务院办公厅《关于进一步加强古籍保护工作的意见》指出要制订古籍数字化标准,规范古籍数字化工作,建立古籍数字资源库。要整合现有资源,建立面向公众的古籍门户网站[80]。新疆维吾尔自治区人民政府办公厅《关于进一步加强我区少数民族古籍工作的通知》指出要全面了解和掌握本区少数民族古籍的存量、分布和流传情况,特别要做好对民间少数民族古籍和口碑传承古籍的保护和征集工作,实现古籍分级保护,为建立中华古籍联合目录和古籍数字资源库提供基础资料[81]。只有注重数据标准化和规范化,建设统一的数据标准和元数据体系,加强不同系统之间的数据交互和共享,制定并贯彻执行数据管理的规范,确保数据的质量和特色,提高数据资源的可信度和可用性,才能发挥数据基础设施建设作为推进文化数字化战略的关键支撑作用,才能形成数字人文研究能用、可用、好用的数据资源,从而发挥数字人文研究服务国家文化数字化等重大战略的作用。

四、数字人文技术发展与政策支撑的趋势、问题及建议

(一)技术发展趋势及影响

毫无疑问,技术的发展趋势影响数字人文的前行进路。2022年,新华三集团发布《面向未来的数字社会——2022十大技术趋势白皮书》[82],将扩展现实推进元宇宙、云边协同促进智能机器人、隐私计算安全释放数据价值、通用基础模型降低AI门槛、新异构计算架构提供多样化算力等总结为“支撑下一个十年的十大技术发展趋势”。2024年1月,中国信息通信研究院发布《全球数字经济白皮书(2023年)》[83]指出以5G为代表的新型网络技术开启万物互联时代、以人工智能(AI)或人工智能生成内容(AIGC)为代表的新型分析技术突破人类能力边界、以区块链为代表的新型互信技术支撑可信业务协作等数字化转型趋势加速。技术行业白皮书在一定程度上表明,新一代人工智能、元宇宙、区块链等数字技术是数字经济稳健发展和数字社会加快构建的广域蓝海。由此,本小节以新一代人工智能、元宇宙技术、区块链三大风口为技术典型,眺望其发展趋势和可能给数字人文带来的影响。当然,挂一漏万,还有很多技术将会投身数字人文领域待来人探索。

1.新一代人工智能算法、算力和数据持续突破

新一代人工智能通常指人工智能领域的发展和技术进步,如更先进的算法、更强大的算力、更大规模的数据、更广泛的应用领域等。2023年,大模型、生成式人工智能等标志性技术革新推动了人工智能2.0时代到来[84]。超大规模预训练模型、跨模态预训练模型效果不断提升,现已能够处理文本、图像、语音三种模态数据,而未来使用更多图像编码、更多种语言以及更多类型数据的预训练模型会继续涌现[85]。鉴此,数字人文可以在现有数据处理方式上迭代增效,利用规模更大、模态更多的大模型算法,更高效、更准确地完成多源异构内容转化、海量数据集建设等数字人文研究基础工作。同时,轻量化深度学习技术不断发展,逐渐破除传统深度学习模型难以在存储空间和资源受限的环境下部署的障碍,数字人文可以借鉴其在大模型压缩剪枝、量化网络参数训练、大模型蒸馏等方向的算法优化从而设计出更紧凑高效、响应速度更快的模型来处理和分析多媒体数据,并拓展在移动设备、嵌入式系统等多种场景的应用。此外,AIGC不断成熟,未来听、说、读、写等能力将有机结合,可望在创意写作与生成艺术、语言学研究、文化遗产保护、语义网络构建等领域拓展数字人文研究方向[86]

2.元宇宙关键技术推进多维发展

2023年11月,中国信息通信研究院等机构发布《元宇宙白皮书(2023年)》指出元宇宙的核心功能原理是数字网络空间与物理世界的开放互联与深度融合,并将元宇宙未来发展趋势总结为依托技术产业体系形成新信息形态、新数字器官、新经济模式、新社会图景等多个维度[87]。首先,以扩展现实(XR)为代表的沉浸式技术起飞提速是进入元宇宙的关键,以手机为代表的传统智能终端难以承载元宇宙概念下的新型人机交互需求(体验式),而XR终端设备发展有望进化为新的数字器官,形成自然互动、虚实沉浸、使用舒适的适人化终端。借助这一技术潜力,数字人文的教育培养、成果展示、文化遗产的数字化保护和传承、数字文旅等重点工作都可以朝着更具互动参与和虚拟沉浸的方向优化。例如可以通过创建虚拟现实环境,将文化遗产的物理形态和历史场景完整呈现,并使其能够被更广泛、更“真实”地参观、访问、互动和学习,同时减少实际遗产的磨损和破坏。其次,3D沉浸式影音技术也是元宇宙虚实结合、身临其境数字体验实现的重要支撑。一方面,人们可以显著感受到三维化、强交互的音视频体验;另一方面,3D沉浸影音将助推内容采集、编辑制作、传输分发、终端呈现等视听产业链上下游的迭代升级[88]。在此技术发展助推下,数字策展、数字动画、数字游戏等数字叙事创意开发可以搭建更具深度和立体感的观影空间,增强观众对历史事件、文化场景的欣赏、理解和情感共鸣。除此之外,沉浸式计算云服务平台的发展将重新定义“虚拟”和现实。云渲染平台侧重视频处理与图形渲染的能力优化,在内容拟真度、交互自由度、时空在线度上不断拓展,可助力数字人文各类系统平台在模拟视觉效果、实现多人实时异地协作方面持续精进[89]

3.区块链技术多样化融合升级

区块链技术自诞生至今十余年时间里,通过与相关信息技术的融合应用,在新一轮科技革命和产业变革中迸发着勃勃生机。《区块链白皮书(2023年)》指出[90],从技术发展态势来看,公有链技术聚焦可扩展性提升,以带动隐私计算技术的融合发展;联盟链技术面向应用深度优化,以满足更广泛的应用场景需求;开放联盟链技术融合公有链和联盟链特点,朝着使用成本较低、生态开放和公信力强等特征优化。从应用发展态势来看,基于区块链的数据共享平台将在数据开发利用、数据价值释放等方面发挥重要作用;数字资产规模和种类增长迅速,市场热度不减;数字身份支撑信任传递,分布式架构成为重要探索方向。[91]基于区块链技术应用和产业发展新趋势,其对数字人文的影响从短期来看,去中心化和加密等特性可以提高数字人文领域文化数据的安全性,加强数字文化资产的保护和溯源,确保其真实性和合法性,进而保障数字化文化资产的价值和信任度。中期来看,随着相关政策出台和数据设施建设的快速推进,公有链、联盟链和开放联盟链技术逐渐成熟,能够更加有力地支撑数字人文海量数据要素可靠、可信、安全流转,并通过区块链平台得到更好的保护和价值释放。同时数字身份系统和信任体系的日趋健全意味着人们可以更加安全、便捷地参与数字文化内容的创造、共享,推动数字人文领域的开放和合作。长期来看,区块链作为Web3.0、元宇宙等新产业的关键底层支撑技术,有望为新兴产业的实现落地探索可体验、可感知的新模式、新业态[92],进一步推动数字人文与Web3.0、元宇宙等概念融合发展。

(二)数字人文技术应用的挑战及应对

总的来看,技术的应用为数字人文带来了丰富的人文知识生产方式、传播教学方式和应用场景。初期致力于针对文本、图像和艺术品的数据库建设和数字工具开发;慢慢发展到数字媒体技术的综合应用,为文化遗产保护和传播书写新的体验篇章并催生出数字艺术、虚拟现实艺术等新兴艺术形态;再到数据科学、机器学习和人工智能的灵活运用,在更高级的工具和算力支撑下,走向更辽远和深刻的问题域。然而,技术与人文学科领域的结合之旅并非一帆风顺,也存在一些值得细究反思的问题。

1.技术运用同质化问题及应对

技术运用同质化是数字人文技术应用的一个基础性问题。如从数据统计来看,许多数字人文项目开展路径为数据库建设,输出载体为网站,在成果推广和展示上表现较为单薄,在数字媒体、人工智能、元宇宙等前沿技术的融合运用上略显欠缺。这些研究采用相似的数字技术工具和方法,可能会导致研究设计缺乏多样性和创新性,研究结果缺乏新颖性和深度,不利于数字人文研究方法的创新和突破。同时,技术的同质性也会导致在数字人文研究中忽略某些领域或主题的新问题,造成研究视角的局限,不利于全面理解和诠释本身就十分复杂的文化、历史和社会现象。

面对这一问题,可积极鼓励数字人文研究者尝试使用不同类型、新兴的数字工具和手段,积极采用混合方法研究,创新研究设计和思路,尽量使用不同方法、从不同的渠道获取数据,丰富数字人文研究的问题视角,并积极开展跨学科研究,引入不同学科的方法和理论,扩展数字人文研究的广度和深度。

2.前沿技术自主性、原创性和开放性不足及应对

当前中国数字人文领域所使用的方法技术已有初步的开拓创新,如“云游长城”“数字敦煌”等文化遗产数字化保护项目中使用的腾讯自研的PCG工具、云游戏技术,但大量的方法技术仍引鉴自国外,尤其是机器学习技术、大模型技术的应用,对国外的开源模型如BERT、GPT等依赖性较大[93]

在未来的发展中,需要加大对数字人文领域的技术创新投入,鼓励更多的企业和机构进行原创性技术研究,并积极建立开源社区,提供资源共享、技术交流、联合研发的共享平台和机制,进一步推动技术创新和应用。

3.技术介入导致偏见问题及应对

一方面,数字技术的应用会取代一部分传统人文研究的工作,比如人文资源的数据采集、处理等工作由机器替代,绘画等艺术美学由生成式人工智能完成,这既是提高研究工作效率的表现,又可能会给传统人文学者带来恐慌和不安,认为技术使用会丢失传统人文学科的文化意义和精神信仰,造成技术使用的偏见问题,甚至是数字人文研究者与传统人文研究者之间的矛盾对立;另一方面,数字技术已经在不容拒绝地改变着传统人文学科的研究场景,因此技术很容易成为数字人文研究的中心,尤其是技术驱动下的数字人文项目,人文学者可能在繁杂的技术池中迷失方向,导致相关研究仅仅停留于人文素材的整理、访问和传播等浅层问题上,而未深入人文研究的核心痛点。

因此,一方面,人文学者需要正视数字技术并积极投身技术的应用,为数字与人文的联姻提供重要的人文领域知识、关键问题和真实需求,挽救数字时代人文学科的式微。另一方面,迫切开展数字人文的批判性和反身性思考,改变“技术先行、理论落后”的发展现状,积极构建数字人文学科理论体系,深化数字人文学术内涵,有效延展观察历史、文化和社会的平台。

4.技术运用引发伦理问题及应对

数字人文研究在涉及大量数据和使用新兴技术时,常常涉及人文领域的文化、社会、历史等敏感议题,因此不可避免地会产生一些新的伦理问题,如隐私问题。数字人文研究在进行大规模的数据收集、分析和处理时有可能会涉及个人身份信息、敏感信息,例如社交媒体数据收集,是否告知数据风险和获得个人知情同意都值得商榷。同时数字人文研究中的数据共享与开放原则与个体隐私之间也存在着天然冲突。此外,技术的使用也可能会增强社会研究机会的不平等,一些传统的人文学者无法获得或充分利用新技术,导致社会科学研究的数字鸿沟扩大。可见,数字人文领域技术的工具理性需要道德感性的约束,应根据本领域特点制定明确的伦理标准,这些标准应指向隐私保护、数据共享、文化倾向等方面以确保数字人文研究在社会伦理框架内进行。如提高研究透明度,明确研究的目的、方法和可能的风险,确保研究参与者充分了解研究过程,并获得同意知情,特别是在涉及个人数据的情况下。同时也应该建立伦理审查机制,对数字人文项目涉及的技术进行审查,确保项目的设计和实施符合伦理标准,确保其不带有偏见、不侵犯隐私,并尽量避免对特定人群的歧视性影响。

(三)政策环境发展建议

1.促进数字人文相关政策相互衔接

数字人文的发展将紧密服务于国家文化数字化和中华文化全面复兴等重要国家战略。为了贯彻这一目标,应注重文化数字化与国家在文化保护、教育创新、科技发展等方面的重大战略相对接,将文化数字化发展重点与国家的发展目标紧密结合,并在配套政策中予以体现。比如,将文化数字化科技创新纳入科技发展重大发展方向;将文化数字化纳入智慧城市建设、数字经济发展等;将文化数据作为重要的数据要素资源;出台艺术资源、文物资源的数字化保护与开发利用相关的政策,积极做好新时代下中华优秀传统文化的创造性转化和创新性表达;鼓励利用数字人文工具和方法,如数字化和3D重建技术,保护和传播国家的文化遗产。积极发挥数字人文研究推动文化繁荣、科技创新、经济发展等多个方面的作用。

2.优化数字人文专业教育相关政策

人才培养是政策编码结果中的一个重要方面,体现出当下国家发展对专业人才的迫切需要。新文科建设的全面部署为数字人文的发展提供了全新的机遇。数字人文教育相关政策首先应该明确更为合理的学科归属。2021年11月,国务院学位委员会印发了《交叉学科设置与管理办法(试行)》,并设置了若干交叉学科[94]。2023年4月,“数字人文”进入最新的《普通高等学校本科专业目录》,归入“文学”门类下的“中国语言文学类”。而在研究生教育层次,数字人文学位点在“信息资源管理”学科之下。冯惠玲教授指出,尽管数字人文教育尚未成熟,如果必须进入一个一级学科的话,还是进入交叉学科相对合理,在其多学科交叉教育中面临的大量新问题需要在教育实践中逐一应对和破解[95]。其次,需要建立完善跨学科能力教育体系、培养体系,包括实践教育、导师配备、科技成果评价等。此外,还需要发挥数字人文教育对传统人文教育的支撑和牵动作用,将数字人文方法和工具纳入传统人文学科的课程中,强化学生的实践能力和数字素养,提高学生对人文数据的敏感性和分析能力。

3.发展数字人文相关产业政策

产业是数字与人文结合的直接赋能者,需要不断拓宽数字人文的应用场景,挖掘数字人文产业的巨大潜力。如在文化产业创新领域,数字人文技术和方法可应用于电影、游戏、数字艺术等领域,提供新的创意和用户体验;通过利用人工智能、大数据分析等现代技术,数字人文可以提升文化产品的创新能力,如通过算法生成的艺术作品,或利用虚拟现实技术重现历史场景。因此,在政策制定和完善的过程中,需要着力推动和支持数字文化相关产业的持续发展:应加强对创新和技术研发的支持,包括提供资金支持、税收优惠以及研发设施;制定有效的监管政策以保护知识产权,同时鼓励公平竞争;促进产学研结合,加强与高等院校和研究机构的合作,培养行业所需的专业人才;积极参与国际交流与合作,借鉴国际成功经验,提升中国数字文化产业的国际竞争力。

结语

总体而言,技术与政策是驱动中国数字人文发展的两辆马车。数字技术的发展和应用为文学、史学、语言学和艺术学等传统人文学科的问题解决提供了新的视野和方法工具,如海量人文数据高效收集、永久保存、准确分析,数字内容创新展示、沉浸交互,以及数字人文成果数字出版、广泛传播等。未来,数字人文还会利用更多新兴技术方法和手段来实现数字和人文的学科破立。元宇宙、物联网、区块链技术乃至量子计算等尖端科技将以更合理的、更适配的方式引入数字人文,为数字人文的繁荣提供蓬勃的生命力。技术会始终处于不断发展变化之中,数字人文技术应用体系也将不断被补充和重塑。与此同时,相关政策的出台和实施为技术和人文的结合提供了指导和保障。

数字人文作为一个跨学科领域,在贯彻国家战略、人才培养、产业发展等方面发挥着重要作用。通过紧密结合国家的文化和科技发展战略,数字人文能够为国家文化的数字化转型和中华文化的全面复兴提供强有力的支持。同时,通过重视跨学科的人才培养和创新思维的培育,数字人文有助于培养出一代既了解传统人文学科又精通现代科技的新型人才,为社会发展注入新的活力。此外,数字人文未来将有丰富的应用场景,不仅能推动文化产业的创新发展,还能在商业决策、公共服务、城市管理等多个领域中发挥其独特优势。因此,数字人文不仅是一门学科,更是一个连接传统与现代、文化与科技、理论与实践的桥梁,对于推动社会进步和文化繁荣具有不可或缺的作用。

附表1 中国数字人文项目主要技术应用列表(不完全统计)

续附表1

续附表1

续附表1

续附表1

续附表1

续附表1

续附表1

续附表1

续附表1

续附表1


[1] 王军:《从人文计算到可视化——数字人文的发展脉络梳理》,《文艺理论与批评》2020年第2期。

[2] 王晓光:《“数字人文”的产生、发展与前沿》,2009年教育部人文社会科学研究方法创新论坛论文,重庆,2009年11月。

[3] 陈静:《当下中国“数字人文”研究状况及意义》,《山东社会科学》2018年第7期。

[4] 董洪川、潘琳琳:《数字人文与外国文学研究范式转换》,《西南民族大学学报(人文社科版)》2018年第9期。

[5] 陈涛等:《LIBRA技术理论及其在史料图像资源中的应用》,《大学图书馆学报》2022年第4期。

[6] 蔡迎春:《特色资源建设中的数字人文应用进展研究——基于国内数字人文相关项目及实践案例》,《图书馆建设》2018年第7期。

[7] 刘炜、叶鹰:《数字人文的技术体系与理论结构探讨》,《中国图书馆学报》2017年第5期。

[8] 《国家知识产权局办公室关于印发〈关键数字技术专利分类体系(2023)〉的通知》,2023年9月25日,https://www.cnipa.gov.cn/art/2023/9/25/art_75_187769.html,2024年2月20日。

[9] 肖荻昱:《基于CiteSpace的图书馆智库服务研究可视化分析》,《图书馆工作与研究》2018年第11期。

[10] 包琛、汪云海:《词云可视化综述》,《计算机辅助设计与图形学学报》2021年第4期。

[11] 张强等:《基于知识重构的词人时空情感轨迹可视化研究——以辛弃疾为例》,《情报学报》2023年第6期。

[12] 戴梦菲等:《AR技术在数字人文应用上的运用策略——以“从武康路出发”应用为例》,《图书情报工作》2021年第24期。

[13] 刘江峰等:《数字人文视域下SikuBERT增强的史籍实体识别研究》,《图书馆论坛》2022年第10期。

[14] 张毅、李欣:《面向数字人文的特藏资源揭示研究——以方志数据库建设为例》,《图书馆》2019年第6期。

[15] 高劲松、韩牧哲:《考古发掘资料图数据库的语义关联构建研究》,《图书情报工作》2021年第9期。

[16] 曹高辉等:《数据科学理论与前沿:专业建设与科学研究》,《图书情报知识》2023年第2期。

[17] 左娜、张卫东:《面向数字人文的档案资源整合模式构想:解构与重组》,《档案学通讯》2020年第3期。

[18] 张芳霖、王毓婕:《近代商会档案数据资源整合的意义、底层逻辑和实现路径》,《档案学通讯》2023年第3期。

[19] 边媛:《面向数字人文的中央苏区档案数据多源整合的动因、条件与路径研究》,《档案学研究》2022年第5期。

[20] 张毅、赵晨鸣、陈丹:《数字人文在高校图书馆特藏资源建设中的实践与思考——以近代中译本全文特藏库建设为例》,《国家图书馆学刊》2023年第1期;陈以敏、张青青:《数字人文下高校图书馆手稿特色数据资源库建设研究》,《图书馆》2021年第6期。

[21] 孙宇:《数字人文背景下音乐图书馆音乐文献资源数字化建设研究》,《图书馆工作与研究》2023年第3期。

[22] 马玉静:《“数字人文”视域下的博物馆文化遗产数据资源开发模式研究》,《中国博物馆》2022年第4期。

[23] 肖鹏:《把“专题数据库”作为方法:数字人文的重新认识及其在AI时代的发展趋势》,《图书情报知识》2023年第5期。

[24] 孙建军:《专题导语:推进人文社科专题数据库建设规范化管理研究》,《现代情报》2019年第12期。

[25] 胡娟、柯平:《我国图书馆数字人文项目建设经验与启示——以上海图书馆家谱知识服务平台项目为例》,《图书馆工作与研究》2022年第1期。

[26] 夏翠娟等:《家谱关联数据服务平台的开发实践》,《中国图书馆学报》2016年第3期。

[27] 童茵、张彬:《董其昌数字人文项目的探索与实践》,《中国博物馆》2018年第4期。

[28] 马翠嫦、王蕾:《史学话语体系视角下徽州文书领域主题多维结构研究》,《图书馆杂志》2022年第7期。

[29] 李永卉等:《碑刻资源语义化组织研究》,《数字图书馆论坛》2021年第12期。

[30] 赵薇:《量化方法运用于古代文学研究的进展和问题——以近年数字人文脉络中的个案探索为中心》,《文学遗产》2022年第6期。

[31] 魏会洋、袁曦临:《社会网络分析在文学阅读研究中的适用性问题——以数字人文视角下的〈白鹿原〉人物关系阐释为例》,《新世纪图书馆》2019年第3期。

[32] 诸雨辰:《自然语言处理与古代文学研究》,《文学遗产》2022年第6期。

[33] 陶慧丹等:《基于BERT的民间文学文本预训练模型》,《计算机技术与发展》2022年第11期。

[34] 郭佳欣等:《〈长安十二时辰〉对唐长安城市空间的当代重构——一种文学制图的视角》,《数字人文研究》2021年第2期。

[35] 范文洁、李忠凯、黄水清:《基于社会网络分析的〈左传〉战争计量及可视化研究》,《图书情报工作》2020年第6期。

[36] 刘浏等:《〈春秋〉三传女性人物的人文计算研究》,《图书情报工作》2020年第23期。

[37] 朱子彤:《循史纳新:中国电影知识体系下数字人文与影人年谱的可视化》,《电影评介》2023年第7期。

[38] 乔宁:《数字人文时代基于社会网络分析法的影人年谱研究初探》,《电影评介》2022年第2期。

[39] 王斯加等:《TCPVis:基于谢赫六法的传统中国绘画画派可视分析系统》,《图学学报》2024年第1期。

[40] 耿凌艳:《音乐可视化设计中的映射探究——以Thayer情绪模式与伊顿色彩理论的对应关系为例》,《装饰》2017年第7期。

[41] 李嘉俊等:《基于预训练语言模型的古籍文本智能补全研究》,《数据分析与知识发现》2024年第5期。

[42] 谢靖、刘江峰、王东波:《古代中国医学文献的命名实体识别研究——以Flat-lattice增强的SikuBERT预训练模型为例》,《图书馆论坛》2022年第10期。

[43] 赵连振等:《面向数字人文的先秦两汉典籍自动标点研究——以SikuBERT预训练模型为例》,《图书馆论坛》2022年第12期。

[44] 徐润华等:《面向古籍数字人文的〈资治通鉴〉自动摘要研究——以SikuBERT预训练模型为例》,《图书馆论坛》2022年第12期。

[45] 耿云冬等:《面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例》,《图书馆论坛》2022年第6期。

[46] 刘畅等:《面向数字人文的融合外部特征的典籍自动分词研究——以SikuBERT预训练模型为例》,《图书馆论坛》2022年第6期。

[47] 刘欢、刘浏、王东波:《数字人文视角下的领域知识图谱自动问答研究》,《科技情报研究》2022年第1期。

[48] 周莉娜、洪亮、高子阳:《唐诗知识图谱的构建及其智能知识服务设计》,《图书情报工作》2019年第2期。

[49] 石斌、王昊、邓三鸿:《基于图像模态迁移与集成的中国陶瓷派系识别模型构建研究》,《数据分析与知识发现》2023年第12期。

[50] 《“云游长城”上线——解锁文化遗产保护新密码》,2022年6月27日,https://baijiahao.baidu.com/s?id=1736731480137277111&wfr=spider&for=pc,2024年2月20日。

[51] 《当古老文化遗产遇上先进数字化,会发生什么神奇反应?》,2022年6月11日,https://baijiahao.baidu.com/s?id=1735353330656120460&wfr=spider&for=pc,2024年2月20日。

[52] 《什么是元宇宙?为何要关注它?——解码元宇宙》,2021年11月19日,http://www.news.cn/2021-11/19/c_1128081263.htm,2024年2月20日。

[53] 张新新等:《共创元宇宙:理论与应用的学科场景》,《信息资源管理学报》2022年第5期。

[54] 刘炜、叶鹰:《数字人文的技术体系与理论结构探讨》,《中国图书馆学报》2017年第5期。

[55] 李丽红:《云冈石窟数字化历程》,《文物鉴定与鉴赏》2022年第7期。

[56] 《中国文化遗产数字化研究报告》,2023年2月22日,https://mp.weixin.qq.com/s/KpTYUfJ888om5H63ConogQ,2024年2月20日。

[57] 王佳:《我国水下文物遗产数字孪生系统构建的必要性和可行性》,《长江丛刊》2018年第9期。

[58] 张方等:《桥梁文化遗产的规划与保护2020年度研究进展》,《土木与环境工程学报(中英文)》2021年第S1期。

[59] 桑懿等:《长城文化遗产数字孪生技术框架与应用研究》,《科技创新与应用》2021年第35期。

[60] 《故宫·腾讯联合创新实验室落成,以下一代互联网技术打造智慧文博样板间》,2023年5月19日,https://baijiahao.baidu.com/s?id=1766283827211353688&wfr=spider&for=pc,2024年2月20日。

[61] 朱蓓琳:《“数字人文+”智慧文旅应用产品的功能展望》,《图书情报工作》2021年第24期。

[62] 陈燕琳:《基于区块链技术的公共图书馆古籍数字化版权保护策略》,《图书馆工作与研究》2023年第5期。

[63] 高劲松等:《基于区块链的馆藏文物信息资源共享模型研究》,《情报科学》2022年第9期。

[64] 《“十三五”国家战略性新兴产业发展规划》,2016年11月29日,http://www.gov.cn/zhengce/content/2016-12/19/content_5150090.htm,2024年2月20日。

[65] 《中共中央办公厅 国务院办公厅印发〈关于实施中华优秀传统文化传承发展工程的意见〉》,2017年1月25日,https://www.gov.cn/zhengce/2017-01/25/content_5163472.htm,2024年2月20日。

[66] 《文化和旅游部关于推动数字文化产业高质量发展的意见》,2020年11月18日,https://www.gov.cn/zhengce/zhengceku/2020-11/27/content_5565316.htm,2024年2月20日。

[67] 《新文科建设工作会在山东大学召开》,2020年11月3日,http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202011/t20201103_498067.html,2024年2月20日。

[68] 《国务院学位委员会关于印发〈交叉学科设置与管理办法(试行)〉的通知》,2021年11月17日,http://www.moe.gov.cn/srcsite/A22/s7065/202112/t20211203_584501.html,2024年2月20日。

[69] 《中共中央办公厅 国务院办公厅印发〈关于推进实施国家文化数字化战略的意见〉》,2022年5月22日,https://www.gov.cn/zhengce/2022-05/22/content_5691759.htm,2024年2月20日。

[70] 《省委办公厅、省政府办公厅印发〈四川省推进国家文化数字化战略实施方案〉》,2023年1月11日,https://www.sc.gov.cn/10462/10464/10797/2023/1/11/96015d3237c5494e9607cf78a2b4754c.shtml,2024年2月20日。

[71] 《西藏出台推进实施国家文化数字化战略的实施方案》,2023年5月14日,https://www.gov.cn/lianbo/difang/202305/content_6857652.htm,2024年2月20日。

[72] 《宁夏出台〈关于贯彻落实国家文化数字化战略的实施方案〉》,2022年11月7日,http://nx.people.com.cn/n2/2022/1107/c192482-40184196.html,2024年2月20日。

[73] 《中共中央办公厅、国务院办公厅印发〈关于实施中华优秀传统文化传承发展工程的意见〉》,2017年1月25日,https://www.gov.cn/zhengce/2017-01/25/content_5163472.htm,2024年2月20日。

[74] 《中华人民共和国公共文化服务保障法》,2016年12月25日,http://www.npc.gov.cn/zgrdw/npc/xinwen/2016-12/25/content_2004880.htm,2024年5月8日。

[75] 《中华人民共和国国民经济和社会发展第十三个五年规划纲要》,2016年3月17日,https://www.gov.cn/xinwen/2016-03/17/content_5054992.htm,2024年5月8日。

[76] 张海、陈宇轩、王东波:《信息资源管理领域数字人文研究特征、研究体系及构建路径》,《情报理论与实践》2024年第2期。

[77] 《国家互联网信息办公室发布〈数字中国建设发展报告(2017年)〉》,2018年8月17日,http://digital.china.com.cn/2018-08/17/content_40465726.htm,2024年5月8日。

[78] 《文化和旅游部关于推动数字文化产业高质量发展的意见》,2020年11月18日,https://www.gov.cn/zhengce/zhengceku/2020-11/27/content_5565316.htm,2024年2月20日。

[79] 《国务院印发〈关于加强数字政府建设的指导意见〉》,2022年6月23日,https://www.gov.cn/xinwen/2022-06/23/content_5697326.htm,2024年5月8日。

[80] 《国务院办公厅关于进一步加强古籍保护工作的意见》,2007年1月29日,https://www.gov.cn/zwgk/2007-01/29/content_511825.htm,2024年5月8日。

[81] 《关于进一步加强我区少数民族古籍工作的通知》2012年5月24日,https://www.xinjiang.gov.cn/xinjiang/zjgl/201205/f37c584084d74ee1b76ef02372c52ebb.shtml,2024年5月8日。

[82] 《2022十大技术趋势白皮书:面向未来的数字社会》,2022年6月23日,https://kw.beijing.gov.cn/art/2022/6/23/art_9260_631042.html,2024年2月20日。

[83] 《全球数字经济白皮书(2023年)》,2024年1月,https://aigc.idigital.com.cn/djyanbao/%E3%80%90%E4%B8%AD%E5%9B%BD%E4%BF%A1%E9%80%9A%E9%99%A2%E3%80%91%E5%85%A8%E7%90%83%E6%95%B0%E5%AD%97%E7%BB%8F%E6%B5%8E%E7%99%BD%E7%9A%AE%E4%B9%A6%EF%BC%882023%E5%B9%B4%EF%BC%89-2024-01-08.pdf,2024年2月20日。

[84] 《〈新一代人工智能基础设施白皮书〉发布》,2024年1月3日,http://finance.people.com.cn/n1/2024/0103/c1004-40151817.html,2024年2月20日。

[85] 《人工智能白皮书(2022年)》,2022年4月,http://www.caict.ac.cn/kxyj/qwfb/bps/202204/P020220412613255124271.pdf,2024年2月20日。

[86] 王静静、洪贇、叶鹰:《GPT型技术应用重塑数字人文探讨》,《情报理论与实践》2023年第6期。

[87] 《元宇宙白皮书(2023年)》,2023年11月,http://www.caict.ac.cn/kxyj/qwfb/bps/202311/P020240326626098688125.pdf,前言,2024年2月20日。

[88] 《元宇宙白皮书(2023年)》,2023年11月,第18—19页。

[89] 《元宇宙白皮书(2023年)》,2023年11月,第21—22页。

[90] 《区块链白皮书(2022年)》,2022年12月,http://www.caict.ac.cn/kxyj/qwfb/bps/202212/P020230105572446062995.pdf,2024年2月20日。

[91] 《区块链白皮书(2022年)》,2022年12月,第15—26页。

[92] 《区块链白皮书(2022年)》,2022年12月,第35—37页。

[93] 夏翠娟、祁天娇、徐碧姗:《中国数字人文学术体系构建考察——基于实践项目的内容分析和文献研究》,《数字人文研究》2023年第4期。

[94] 《国务院学位委员会关于印发〈交叉学科设置与管理办法(试行)〉的通知》,2021年11月17日,http://www.moe.gov.cn/srcsite/A22/s7065/t202112/20211203_584501.html,2024年2月20日。

[95] 冯惠玲:《新文科与数字人文教育之新》,《数字人文研究》2022年第4期。