2025年4月北大的这场人工智能与口述史研究演讲,你还不了解?

人工智能与口述史研究

演讲者:杨祥银,演讲的场所:北京大学科学技术与医学史系,演讲的具体时间:2025年4月。

杨祥银,中国人民大学历史学院的教授,同时担任中华口述历史研究会副会长一职。专注于口述史领域的研究,撰写了《与历史对话:口述史学的理论与实践》、《美国现代口述史学研究》等专著;担任《多学科视域下的当代中国口述史学研究》及《口述史研究》(共四辑)的主编;在《历史研究》等学术期刊上发表了超过四十篇学术论文;同时,负责并正在进行多项国家社会科学基金项目的开展;荣获教育部颁发的第八届高等学校科学研究优秀成果奖(人文社会科学)青年成果奖等荣誉。

口述史这一在二战后崭露头角的研究方法与学科领域,不仅具有学术研究的价值,还涵盖了社会行动的议程和公共历史的意义。它的兴起与成长,在很大程度上得益于科学技术的进步和运用。如今,伴随着人工智能技术的飞速进步,这一领域正面临着前所未有的机遇与挑战。人工智能在语音识别、自然语言处理、机器学习、计算机视觉、知识图谱、机器翻译、大数据挖掘等领域取得的突破和广泛应用,极大地推动了口述史的采集、整理、保存、分析、传播及利用等各个环节,为口述史的研究和实践带来了新的生机和活力。人工智能不仅显著提升了口述史工作的效率与品质,而且更为历史记录、解读及阐释带来了全新的观察角度与处理手段。

近期,学界对人工智能与口述史相结合的研究路径展开了尝试。不过,这一领域的系统化研究尚显薄弱。多数研究仅停留在技术应用的局部层面,未能对口述史全流程的智能化进行全面的考量;在构建人工智能助力口述史的理论体系方面,尚不够成熟,研究方法和路径的探索也较为分散;同时,对技术应用可能引发的伦理问题和风险预警的关注也显得不足。本次讲座的目的是对人工智能在口述史各个阶段的应用进行详尽剖析,同时研究人工智能与口述史相结合的深度融合及其潜在的限制,并就其未来的发展走向进行预见性的预测。

一位游客在北京中关村国家自主创新示范区的展示中心轻抚了一只仿生五指灵巧手。新华社摄影报道。

智能化采集:打破传统采集模式的局限

人工智能正以前所未有的规模和深度融入口述史采集的各个阶段,促使口述史采集方式从传统的“面对面”交流转变为“人机互动”,并从被动的“提问—回答”模式转变为主动的“沉浸式体验”。在以往,口述史采集主要依赖受过专业训练的访谈者,他们通过面对面的访谈方式来记录个体的生活经历。该模式在很大程度上取决于访谈者的技能与过往经验,并且受到时间、地理、人力等实际条件的诸多制约。

人工智能正全面革新口述史资料的收集流程,这一变革亦涵盖了访谈前的各项筹备工作。在传统的口述史资料准备阶段,研究人员需投入大量时间进行资料搜集、深入了解受访者的个人背景、精心制定访谈大纲以及进行模拟演练等活动。人工智能在准备阶段扮演着多角色:它能够迅速对大量资料进行梳理和分析,从而提供详尽的背景资料;在制定访谈提纲时,它能依据受访者的经历及历史资料自动构建结构化的提纲;此外,在模拟访谈环节,它能模仿不同类型受访者的回答方式和情绪反应,为访谈者营造一个接近真实环境的实践场所,新手们可以在虚拟环境中练习提问技巧、聆听艺术以及处理突发事件的能力。

在真实的访谈环节中,虚拟访谈助手这类人工智能系统为口述历史的收集工作带来了更为智能与高效的途径。这些助手是建立在人工智能基础之上的交互式平台,它们运用多种技术手段与受访者进行智能化的交流。它运用自然语言处理技术,对人类语言进行理解和创作,能依据访谈主题自动编制访谈大纲,并根据受访者的个人背景来定制访谈内容。在访谈过程中,它能依据对话的进展实时调整问题的顺序和深度,深入挖掘更多的历史细节。此外,知识图谱技术的应用,进一步增强了口述史智能采集的能力。它通过有序结构展现了繁复的知识关联,每当受访者提及某个历史时刻,系统便能够依托知识图谱提供相应的背景资料,助力受访者更深刻地回忆起那段时光。此外,借助情感计算技术,虚拟访谈助手得以具备感知与理解人类情绪的职能。在访谈过程中,人工智能系统能够实时地通过分析受访者的面部表情和语音,监测其情绪变化,进而据此对访谈的节奏和策略进行相应的调整。

实际上,人工智能在口述史资料的搜集领域已露端倪。部分学者正尝试运用对话型叙事助手进行口述史的搜集工作。这种助手依托于机器学习技术,实现了自然语言处理,并能通过自动化对话方式收集数字化的故事内容。系统通过预设脚本对叙述者进行引导,并给予积极的反馈和鼓励性语言,以此模拟真实的人际访谈过程。该系统运用了“奥兹巫师”原型测试技术,创建了传统聊天机器人和新颖美学风格的两种界面,并兼容文本、语音、视频等多种媒体形式以及多语言功能。它通过提出引导性问题,激发叙述者分享故事,并为其提供即时的反馈和情感上的支持。传统方法主要依靠人工进行访谈,这样的做法既费时又费力,难以将收集范围扩大至庞大的社会群体。相比之下,对话式的叙事助手则被认为是一种有效的手段,它能够拓宽口述史的收集范围,提升工作效率,并且能够触及到更广泛的受众。

口述史访谈领域得以借助智能化手段,同时,人工智能与虚拟现实、增强现实等沉浸式技术的融合,更为采集工作增添了丰富的互动体验。借助虚拟现实技术,受访者得以重返历史现场,而这一技术通过逼真的视觉、听觉、触觉等多重感官刺激,有效唤醒了他们深层的记忆。增强现实技术在访谈环节中能够即时融入历史文件、图像以及地图等辅助信息,从而协助受访者实现时空对比,显著提升口述资料的精确度。

在第二十一届深圳国际文化产业博览交易会现场,众多观众正对人工智能产品进行深入了解。新华社图片报道。

展望未来,人工智能技术的不断进步预示着口述史采集将不断跨越时空的界限。受访者得以利用智能设备在任何时间、任何地点加入访谈过程。多语言兼容与即时翻译功能消除了语言隔阂,让跨文化和跨语言的口述史收集得以实现。尤为关键的是,人工智能技术的广泛应用让口述史不再仅限于专业研究者的范畴,而是转变为全社会共同参与的公共活动。

智能化整理:从烦琐到高效的蝶变

人工智能正以前所未有的规模和深度革新着口述史整理的各个环节,促使口述史整理从依赖人工操作转变为依赖智能处理,从被动的机械整理转变为主动的深度加工。在传统口述史整理过程中,常常需要投入大量的时间和精力,包括音视频资料的手动转录、文本的细致校对、目录的编制、索引的构建、元数据的创建以及内容摘要的撰写等众多繁琐工作。

人工智能技术的飞速发展使得口述史整理的智能化趋势日益显著。在转录阶段,语音识别技术实现了显著的进步。目前,不少自动语音识别系统能够达到较高的转录准确度,并且能够执行智能化的标点、分段、时间戳生成以及说话人标识等操作,即便是在涉及多种语言、口音和说话人的复杂场景中,也表现出了出色的适应性。虽然自动转录可能仍需人工校对,但整体效率提升显著。

在编目与索引这一环节,人工智能技术同样表现出其卓越的效能。依托于命名实体识别、关键词提取以及主题建模等多种算法,人工智能系统能够自动识别并提取人名、地名、事件、时间以及主题等关键信息。通过这些信息,系统可以生成标准化的元数据,并在此基础上构建起层次分明的编目与索引体系。运用知识图谱技术,我们可以自动识别口述史文本中的人物关联、事件发展以及地理数据等信息,并将这些内容以语义网络的形式进行整合。此举不仅显著提升了目录编制的效率与精确度,而且借助深度语义分析,还能实现口述史资料的智能化关联与动态搜索,从而让研究者能够快速找到与特定主题或事件相关的资料。

在摘要提取领域,自动文本摘要技术能够有效增强获取口述史信息的便捷性。相较于传统摘要的撰写,后者往往需要人工进行阅读和主观判断,这不仅耗时较长,而且标准化程度较低。自动文本摘要技术则借助深度学习和自然语言生成模型,对口述史文本进行自动分析,从中提取关键观点,进而生成简洁的摘要。

在实践操作层面,已经涌现出众多专业的辅助工具,它们在口述史的整理过程中扮演着关键角色。这些工具在实现语音转文字、提取关键信息、生成内容概要以及构建索引等方面展现出显著功效,进而促进了口述史资料处理技术的智能化进步。

人工智能技术的创新和应用正引领口述史整理迈向一个全新的智能化阶段。这一变革并非预示着传统的人工处理方式将被彻底淘汰,而是引领着一种“人机合作”的新兴工作模式。在当前这种模式中,人工智能系统主要负责执行自动化的转录、编目和索引、关键词的提取以及自动摘要等技术性工作,与此同时,人类研究者则集中精力于对转录质量进行严格把控、对编目索引的结果进行优化、对关键词进行审核和校正、对摘要的准确性进行验证等需要专业判断的任务,以此保障口述史整理的专业性和精确度。

智能化保存:更安全、更高效的资料管理

人工智能正以前所未有的规模和深度渗透到口述史保存的各个领域,促使口述史保存方式从传统的“物理存储”模式转变为“智能存储”,并从静态的“归档存放”方式转变为动态的“智能管理”模式。以往口述史的保存主要依赖于纸质文件和模拟媒介,例如纸质文稿、录音带、录像带等。这些存储介质在长时间保存期间容易出现物理上的磨损,并且其使用寿命相对较短,这给信息的查找带来了不小的困扰。此外,随着资料量的指数级膨胀,数字化存储技术也遭遇了一系列挑战,包括存储空间迅速减少、数据查找速度降低以及信息安全风险显著增加等问题。而人工智能技术的应用,则为解决这些复杂难题带来了全新的思路和方法。

_koi人工智能_人工口述史智能研究方法

智能化的数据压缩与存储技术显著降低了口述史资料的存储费用。相较于传统数字存储,后者多采用未经压缩的原始格式,例如WAV、MP4等,导致存储空间占用较大。而依托深度学习的智能压缩算法,例如H.266/VVC编码技术,不仅确保了文件质量,还能在保证质量的同时,大幅度减小文件的大小。相较于传统的H.264或H.265编码方式,H.266技术能够将文件大小减少到原来的四分之一甚至一半,进而有效节约了存储空间。

再者,区块链技术为口述史资料的保存创造了更为稳固与可靠的存储空间。尽管口述史资料的数字化使得存储、传播及使用的便捷性得到了显著提高,然而,这也随之带来了数据被篡改、版权被侵犯、隐私信息泄露等潜在的安全风险。凭借其分布式账本、密码学验证以及去中心化共识机制等独特优势,区块链技术为口述史资料建立了一套既不可篡改、又可追溯、且安全可控的数据存储与验证系统。借助智能合约和时间戳技术,对每一份口述历史的存储、查阅以及修改等行为都能实现详尽的记录,同时有效保障了资料的完整性及可靠性。

此外,云计算技术为口述史资料带来了灵活的扩展和按需的存储方式。与传统的本地存储相比,后者需要事先安装大量硬件设备,一旦资料量上升,存储压力也随之增大,且设备更新和维护的费用也相当高昂。云存储则改变了口述史资料的存储模式,使其从固定的静态配置转变为动态的分配方式,使得机构能够根据实际需求来调整存储资源,既减少了初始投资成本,又能灵活应对数据量的未来增长。云存储服务提供商一般会融入人工智能技术,对存储信息进行智能化的压缩处理、重复数据的清除以及自动化的备份操作,以此达到提高存储效率的目的,并增强数据的安全防护和恢复能力。

人工智能技术的深入融合正在引领口述史保存体系迈向智能化转型。通过智能压缩技术,资料存储变得更加高效;借助区块链技术,资料管理得到了更高级别的安全保障;依托云计算技术,数据存储的灵活性得到了极大增强。这些技术的综合运用不仅显著提高了口述史资料的存储效率和使用效果,同时也为数字化存储和智能管理开辟了更加宽广的发展空间。

智能化分析:重塑口述史研究范式

人工智能正以空前的广度和深度,为口述史分析的各个层面注入活力,促使口述史研究的模式从以“主观解读”为主,转变为以“数据驱动”为核心,同时,从单一的“文本细致分析”拓展至多模态的“智能综合解析”。在传统口述史分析中,研究者主要依赖个人的主观理解和经验判断,通过深入文本、归纳总结等方法,挖掘口述史资料的深层内涵。然而,这种以研究者主观认知为基石的研究范式,不可避免地显现出分析效率不高、研究视野受限、难以全面揭示大规模口述史资料中潜在的结构性规律的不足。针对这些问题,人工智能技术为口述史分析带来了全新的研究工具、方法论,以及实现范式变革的潜在机遇,使得研究者得以采用更为系统、高效的方法对口述史资料进行深入研究。

自然语言处理技术对于口述史资料的智能化解析具有重要意义。它能够借助分词、词性标注、句法分析和语义理解等手段,自动从口述史资料中提取关键信息,诸如人物、事件、时间、地点等。同时,这些信息还能被系统化地表示和关联分析,从而助力研究者更精确、全面、迅速地掌握资料的核心内容和发展线索。命名实体识别技术能够自动识别口述史文本中的关键信息,诸如“历史人物”“地理位置”“重大事件”等,并将这些信息分类,从而让研究者能更清晰地把握口述史叙述的总体结构;同时,句法分析和语义理解技术能够揭示叙述中的因果关系、时间序列和事件之间的联系,帮助研究者更准确地理解叙述的逻辑关系和历史发展线索。这些技术能够显著提高信息提取的效率,使得研究者能够更加全面和系统地探索和分析大量口述史资料中的详实内容,进而增强研究的科学性和公正性。

此外,运用知识图谱与语义网络技术,我们可以挖掘口述史资料中隐藏的智慧与深层次联系。知识图谱作为一种以实体与关系为模型的系统化知识展示手段,通过诸如命名实体识别、关系提取与属性标记等手段,将口述史中的角色、事件、地点等要素进行有序的关联。同时,语义网络专注于概念之间的相互联系,将两者融合,便能够构建出一个直观的知识架构。利用这些技术手段,研究者得以清晰洞察个体间的互动网络、事件间的因果关系以及历史进程的多样走向,进而揭露口头历史资料中所蕴含的复杂知识体系。在研究某一重大历史事件的口述史资料过程中,研究者能够运用知识图谱技术,自动形成该事件的叙述结构。与此同时,他们还能借助语义网络分析,探究不同叙述者对事件关键节点的描述方式,并比较这些叙述之间的相似之处与不同点。

此外,数据挖掘与机器学习技术对于从庞大的口述史资料库中挖掘出有价值的模式、趋势以及结构具有重要意义。在传统的口述史研究过程中,研究者通常需投入大量时间进行文本阅读和归纳总结,以识别历史现象的规律。然而,数据挖掘技术能够协助研究者自动识别海量口述史资料中的潜在模式、趋势与结构,从而揭示个体叙述背后的社会变迁和集体记忆的演变规律。通过运用聚类技术,研究者能够对口头历史资料进行主题分类,辨别出各个历史阶段及不同社会阶层所讲述的主题及其关注的焦点;借助情感分析方法,研究者能够分析叙述者在不同事件背景下的情感走向,剖析社会情绪的变化轨迹;而通过观点提取技术,研究者能够自动识别出不同叙述者对某一事件的多种立场,并探讨这些立场是如何受到社会、政治、文化等多重因素的影响。

目前,市面上已经出现了不少卓越的生成式人工智能大型模型,诸如DeepSeek、GPT、Gemini、Claude等。这些模型在自然语言处理、多模态数据分析以及知识推理等领域均表现出卓越的性能。它们不仅能够高效地处理大量的口述史资料,而且还能根据不同的研究主题进行灵活的定制化调整。这些人工智能模型因其卓越的语义理解与知识构建能力,使得研究者能够借助它们对多模态口述史资料进行深入剖析,包括但不限于主题剖析、内容剖析、叙事剖析、话语剖析以及情感剖析等,进而为研究提供更为系统化与结构化的观察角度。

人工智能技术不仅革新了口述史的研究工具与手段,还极大地促进了该领域研究模式的根本变革:它促使研究从传统的人文解释学模式向以数据为核心、技术为动力的新模式过渡。这一变革为口述史研究带来了新的生机与创意,同时也使得口述史在数字人文以及更广泛的跨学科领域中扮演了更为关键的角色。

智能化传播与利用:口述史呈现多维度创新

人工智能正以空前的广度和深度,极大地扩展了口述史的传播途径和应用范围,促使口述史的呈现方式从传统的静态展示转变为沉浸式的交互体验,同时,它也使得口述史从单一的文本记录向智能化的多维应用转变。传统的口述史在表现形式和传播途径上一直受到技术条件的制约,主要借助文本、音频和视频等非动态介质,由于其缺乏互动性和沉浸式体验,因此难以激发广大公众,尤其是年轻群体的兴趣。人工智能与数字人文的交汇正开启口述史传播与运用的全新途径、形式与格局,借助智能展示、智能推荐和智能应用等多种技术手段,能够助力打造更为普及化、互动性和沉浸感的口述史体验。

人工智能驱动的智能展示技术正在对口述史的呈现方式进行全方位的革新,极大地增强了其沉浸感和交互性。以沉浸式现实技术为例,它通过运用增强现实、虚拟现实以及混合现实等多种技术手段,将口述史中原本仅限于文字或影像的内容,转变为人们可以感知和互动的沉浸式体验场景。增强现实技术使得口述史资料得以无痕融入现实环境,比如,游客踏入某历史遗迹或特定场所,系统便会依托定位功能激活相应的口述史内容,让人仿佛身临其境,与历史直接对话。此外,借助混合现实技术,我们还能实时叠加虚拟的历史画面,让用户在现实与虚拟交织的领域中,全方位感受历史的丰富层次。

虚拟人技术为口述史的传播带来了新的活力。依托口述史资料,人工智能得以复现口述者的声音、面部特征、表情等生理细节,并以数字人的形象将这些记忆中的角色展现出来。用户不仅能听到数字人口述者的讲述,还能借助自然语言处理技术与之进行实时交流,提问并即时得到回应,从而享受到真正的互动体验。

虚拟现实技术与体感交互的融合,极大地拓宽了口述史沉浸式体验的范畴。这种技术能够捕捉到用户的身体动作、手势以及面部表情,使得用户能够以一种更为直观和自然的方式,与虚拟环境中的口述史内容进行互动。目前,一些机构已经开始运用虚拟现实技术来重现特定的历史场景,引导参观者通过虚拟环境的引导,进行一场虚拟的遗址“探访”之旅。

当前文生视频技术持续进步,基于口述史文本,自动生成相应的动态影像场景已变为现实,这一变化使得原本抽象的口述记忆变得具体和直观,同时,在数字化的时空环境中,实现了沉浸式的重现效果。在博物馆展览和文化遗产展示的范畴内,文生视频技术的应用极大地丰富了沉浸式体验的边界,促使历史故事的讲述不再局限于静态的文物、文字注释以及音频导览,而是转向了一种更具互动性和情境氛围的动态展示方式。

再者,借助人工智能的智能推荐功能,口述史资料的传播变得更加精确。以往口述史的传播多采用单一方式,难以准确捕捉到听众的兴趣与需求。人工智能系统能够搜集用户的浏览记录和兴趣点等数据,通过协同过滤和内容过滤等算法,自动向用户推荐与之相契合的口述史内容,从而提升了传播的精确度和效果。人工智能系统不仅能够依据用户反馈灵活调整其推荐方案,而且还能有效增强用户对推荐的接受程度和参与热情。

此外,人工智能技术在口述史资源的智能化应用领域提供了无限可能,极大地促进了其在教育、文化和社会生活领域的深度融合。借助自动问答、知识推断、智能分析和辅助决策等功能,人工智能系统能够将口述史资源与其他各类数据资源进行深度融合,进而极大地拓宽了其应用范围。在教育界,将口头历史资料融入智能化的教学平台,借助语音识别、自然语言解析以及虚拟现实等先进技术,能够为学生打造一种深入且互动的学习感受。在舆情与社会研究领域,人工智能系统运用文本挖掘、社会计算以及情感分析等先进技术,将口述史资料、社交媒体数据、新闻报道和学术研究等多源信息进行整合,进而实现关联分析。这一过程为社会舆论趋势的预测和研判提供了基于历史视角的参考依据。

人工智能与数字人文的紧密结合正引领口述史传播与利用领域经历一场颠覆性的变革。借助智能展示技术,观众得以享受身临其境的沉浸式体验;依托智能推荐技术,传播变得更加精准高效;而智能应用技术则让口述史资源在多个领域展现出其独特的价值。这些技术共同作用,正将口述史从单一的历史记录转变为能够引发情感共鸣的丰富叙事媒介。在这一过程中,人工智能不仅促进了口述史的表现形式创新,还从某种程度上改变了历史记忆的保存、传播和体验途径,使得历史档案从静止的形态转变为活跃的文化财富。

挑战与展望:人机协作的口述史新纪元

上述讨论描绘了人工智能在口述史各个阶段产生的重大影响,其追求的理想状态是打造一个涵盖智能采集、整理、保存、检索、分析、传播与应用的综合性智能口述史平台。这样的系统将极大地促进口述史实践与研究模式的根本性转变,使其在数字人文、公共史学、文化记忆等众多领域展现出更为广泛的影响力。

尽管人工智能的应用前景广阔,但现阶段仍遭遇诸多困难。在技术领域,人工智能在语音辨识、地方方言的解析以及隐喻的把握上存在不足,这或许会导致对历史记载的扭曲或误解。在法律和伦理层面,知识产权的维护、个人隐私的保护以及算法可能存在的偏见等问题亟待关注。而在社会层面,数字差距可能引发在口述历史的制作与传播过程中,不同社会群体之间出现的不公平现象。除此之外,过分的依赖技术手段还可能降低口述历史的情感深度和人文内涵,使其偏离了学科所追求的根本宗旨。

面对种种挑战,实现人机协作而非仅仅依赖技术替代,成为了口述史发展的关键路径。人工智能的加入并非是为了削弱人类研究者的核心地位,而是对学术劳动分工进行了新的界定。人工智能能够高效地处理海量数据、辨识表面规律以及执行重复性工作,然而,在研究设计、方法挑选、理论构建、情感洞察以及深度剖析等方面,仍然极大地依赖于人类研究者的专业能力和批判性思维。实际上,研究者们的知识积累和理论造诣对人工智能应用的品质与层次起着决定性作用,这涵盖了如何制定优化指令、评定生成内容的学术价值,以及如何将技术创新与学科理论有效融合。这种合作方式是充满活力的互动过程:研究者指引人工智能的应用走向,而人工智能则提供更为丰富的数据支撑和分析视角,双方在交流中持续优化研究方法和成果。

人工智能时代,口述史的新篇章将以其人机合作作为显著标志,依托学科间的融合与信息的广泛交流,形成一个由研究者、技术高手以及广大民众共同构成的多元化实践平台。口述史的研究者应当主动接纳人工智能技术,增强自身的数字化技能和智能技术应用水平;而技术开发者则需透彻把握口述史的多样性、特性及其价值,研制出满足特定需求的智能化工具。此外,他们还需深刻意识到,口述史作为蕴含大量历史信息、真实语言表述以及深厚人文意蕴的高品质语料库,对于训练大型人工智能模型具有极其重要的意义。这种深度的融合将助力口述史打破传统模式的束缚,进而以更为开放和多元化的形式拓宽研究的广度和深度。它将真正实现技术在人文价值传承与创新探索中的赋能作用,开辟口述史在智能化实践、研究和应用方面的广阔前景和全新的境界。

《光明日报》(2025年07月12日 10版)

免责声明:本站发布的所有文章图片内容,由AI一键生成,根据关键词和其他参数进行文章自动采集、加工、发布。不对文章内容的真实性、合法性、时效性负责。

版权所有 copyright 2019 长子县融媒体中心 XML地图
检益拍 三十头镇卫生院 黄石市委机关幼儿园

关于站点

‌长子县融媒体中心‌是长子县的一个重要媒体机构,主要负责新闻宣传和媒体融合工作。由原‌长子县广播电视台和‌长子县新闻中心合并组建,成立于2018年12月,标志着长子县新闻宣传工作进入了融合发展的新时代‌。长子县融媒体中心位于山西省长子县会堂四楼,是长子县新闻发布和宣传活动的主要枢纽‌。

搜索Search

搜索一下,你就知道。