舆情监测成效(基于网络舆情监测数据的反事实模拟年度评估工作的应用以祁县为例)
基于网络舆情监测数据的反事实模拟年度评估工作的应用以祁县为例
全媒体时代背景下,多源网络数据的兴起带动了城市规划向数智化的改变。住房和城乡建设部、国家文物局《关于加强国家历史文化名城保护专项评估工作的通知》中强调“创新技术手段。各地应积极采用云计算、大数据、“互联网+”等新信息技术手段,加强对名城工作的动态管理,提高名城评估的效率和质量。”在国家历史文化名城祁县的评估工作中,我院城乡发展研究中心项目组在收集公众观点方面,通过应用“新浪舆情通”平台,对2022年度全网舆情数据进行全面搜集,将每季度热门事件进行了梳理汇编,同时形成了网络舆情年度分析总结。
一、数据收集与处理
网络舆情监测的信息源包括微博、微信、今日头条、小红书等公众主流媒体以及各类互动论坛、视频、数字报等网站数据。在祁县名城评估工作中,项目组设置关键词“祁县古城”对全网数据进行搜集。
图1 数据检索界面
借助平台强大的文本处理能力,可以对原始数据进行信息来源、发布时间、作者、发布网站、发布地址等属性信息提取。同时对文本情感、关键词云、实体识别等进行智能判断。从而可以实现对一定时间段内数据信息进行分类统计。
图2 原始数据详情
2022年度“祁县古城”关键词共计获得全网868条发文,互动声量19.21万,影响力值731.46万。各季度数据量统计如下表所示。
二、数据分析
(1)主要网络事件梳理
以第一季度数据为例,按时间纬度进行走势分析。“祁县古城”关键词共计出现10次较大波峰,即本季度共计出现了10次热门网络事件。第一季度季度最热门事件出现在2月22日,主要内容为祁县基础设施改善项目开工仪式的新闻报道。该事件于2月25日形成了二次传播高峰。该事件在微信、今日头条、抖音、小红书、西瓜视频、人民号、懂车帝、58本地版、美篇等多个平台进行了传播。
图3 第一季度信息来源走势
在全年维度下,关于“祁县古城”的信息量发展趋势较为起伏,全年的爆发是在2022年7月。客户端类型的数据较为突出,媒体和网民对此事给予了高度的关注。
图4 2022年度信息传播走势
(2)关键词云
对网络舆情信息进行关键词云提取,可以得到一定时间段内的舆情热门词汇。以一季度为例,热门词汇有“项目”、“施工”、“山西”、“游览”、“文化”、“供水”、“晋商”、“保护”等。
图5 第一季度关键词云
(3)信息源统计
2022年度“祁县古城”涉及信息总量868条,其中客户端391条,微信155条,网站154条,视频81条,微博68条,数字报12条,互动论坛7条。
图6 2022年度网络舆情数据源分析
(4)媒体参与解析
2022年度共计35家媒体参与报道,中央新闻网站占比25.71%。
(5)媒体观点聚类分析
图7 2022年度媒体观点聚类分析
(6)公众观点聚类分析
图8 2022年度公众观点聚类分析
三、应用成效
(1)大数据计算全媒体时代赋予了公众参与城市规划与管理的便捷性,而网络舆情信息的海量性、载体的多元性以及新媒体的泛媒体化使得信息的采集和清洗工作必须借助大数据计算来实现。在祁县国家历史文化名城的评估工作中,借助全网舆情数据,可以对年度信息传播走势、信息来源、热门事件等进行分析,从而可以对年度网络舆情状况进行直观认知。
(2)自然语言处理人工智能的运用带来了强大的文本处理能力。可以对舆情数据进行词法分析、句法分析、语义分析等信息拆解和抽取。在祁县国家历史文化名城的评估工作中,可以对名城对外形象、舆论热门词汇、媒体观点、公众舆论观点等进行分析表达,丰富评估成果。
(3)反事实模拟在传统统计数据(如人口普查、各部门资料)的基础上,基于网络舆情数据的反事实模拟(counterfactual simulations)为历史文化名城的评估工作提供了一种新模式,即通过重构年度历史场景,更加精细地描绘了过去一年名城的公众印象,在分析视角上提供了对名城的多元感知和认知。
四、总结
多源数据的应用为城市规划工作带来了技术方法的革新,基于网络舆情数据的反事实模拟,为名城评估工作和各类规划的编制提供了客观、可量化的指标结论。此外,在名城评估工作中,应进一步提高网络舆情数据的精准度和覆盖度,可通过官方媒体发起话题“#祁县名城保护我有话说#”等,引导公众积极参与话题讨论,提高网络热度。(山西省城乡规划设计研究城乡发展研究中心 王启斌)