第二节 政策文本计算概念

一 政策文本

政策是政府、政党及其他政治团体在特定时期为实现一定的政治、经济、文化和社会目标所采取的政治行动或所规定的行为准则,它是一系列理念、谋略、法律、命令、措施、方法的总称。

政策文本则是政策存在的物理载体。从最广义的角度来说,所有能够反映政策的文本都可以被视作政策文本,政策文本是指因政策活动而产生的记录文献,既包括政府或国家或地区的各级权力或行政机关以文件形式颁布的法律、法规、部门规章等官方文献,也包括政策制定者或政治领导人在政策制定过程中形成的研究、咨询、听证或决议等公文档案,甚至包括政策活动过程中因辩论、演说、报道、评论等形成的政策舆情文本,历来是政策研究的重要工具和载体。

政策文本是一类特殊文本形式,它是在政策制定与实施中所产生的过程性文件,主要包含三个层面的内容,一是各级权力或行政机关以文件形式颁布的法律、法规、规章制度等官方文献;二是政策制定者或政治领导人在政策制定过程中形成的研究、咨询或决议等资料;三是政策实施过程中相关演说、报道、评论等。因而,政策文本一直被研究者作为政策内涵解读和政策需求解析的重要研究素材。

二 政策文本计算

政策文本计算是数智环境下融合计算机理论、思维与方法,将政策文本作为研究对象,进而实现科学化的政策研究过程。它通过自然语言处理将政策文本解析为结构化文本数据,并构建政策词语、语义或情感等特殊对象,不仅能形成对大规模体系化的政策文本的系统化处理,挖掘蕴含在政策交流系统中的语义与价值情感,以此获知和解读政策主题、政策热点、政策立场、意识形态、政策倾向、政策价值、政策情感、政策态度等深层次政策内涵,还能在不同政策文本中进行比较与协同分析,尤其是在政策文本数据挖掘过程中注重以大量政策文本数据中发现分类、聚类等特征、发现关联知识或规则,并注重深层潜在语义的知识发现,以此分析政策行为、公众政策意见和评估政策结果[3]。相对于政策文本量化分析,政策文本计算在一系列大数据分析模型和方法的支撑下,分析规模和精度都大幅提升,也避免了主观判断带来的偏差,弥补了现有政策量化研究的不足。政策文本计算具有以下两个重要特点。

(一)政策文本计算是一种非介入性研究方法

政策文本计算作为政策分析的一种非介入性方法引入政策科学领域。非介入性方法的特点是研究结果的中立与客观性,弱化了研究者的主观因素。在传统政策分析中,一般以政策利益相关者的心理或行为假设为出发点,以公共政策绩效或调整结果为评价,并对政策过程、政策工具的可行性进行相关评估研究。因此,不论是运用控制论、运筹学或博弈论等过程分析方法,还是运用行为科学、社会心理学、组织理论、群体理论等行为解释理论,或是预设一定的分析框架予以验证,都不可避免地要预设政策立场以及政策价值取向,将其作为政策分析的判断标准。而政策文本计算认为政策文本已经蕴含政策的语义与价值情感,研究者无须再设计相应的政策框架,仅需要识别或提取政策文本中蕴含的语义,并有序表达。

(二)政策文本计算试图使研究更具科学性

政策文本计算的核心是针对政策文本的自然语言处理,即政策语法及语义层面的解析。虽然众多政策文本计算研究者试图构建语法文本与语义文本、语用文本的映射关系,或依据研究者的理解构建分析词表或抽取若干政策元素或属性,然后以“聚焦”方法跟踪研究。但是随着政策文本数量的激增和开放获取便捷性的提升,加之自然语言处理技术的快速发展,语言识别的准确度大幅提升,并已经得到广泛应用,基于海量政策文本的语义自动提取方法日益成熟,在显性政策要点、政策情感以及政策立场领域的识别精度越来越高。从政策文本计算的分析结果看,政策文本分析结果的可解释性是使政策研究更具科学性的关键所在,很多研究者认为,加强政策的解释性分析,并将计算方法和质性方法相融合更具有应用前景。