审计

微博水军与虚假信息扩散审计

面向微博虚假信息扩散与水军参与的探索式可视分析。系统呈现协同信号, 不对账号作定罪式判断。

v.0.6 / 课程原型
01 / 数据集

来源与规模

编号 01

23,622 条信息实例

覆盖虚假信息、已核验信息与热点声明的微博信息实例。

编号 02

扩散边

每一次转发、评论或态度反馈都会进入传播结构。

编号 03

用户标签

核心用户集合含人工标注的水军/真人/未知标签;其余为弱代理信号。

编号 04

匿名文本

用户 ID 经 SHA-256 哈希;证据文本被截断,不提交原始账号名。

编号 05

信号,不是定罪

水军分数只是代理指标,系统不会指控任何账号具有恶意。

正在加载叙事网络...
02 / 案例研究

背景网络审计

01 / 总览01 / 08

2023 年夏天的异常信号

2023 年 4 月至 8 月,微博虚假信息量骤增。6 月单月假新闻 1,605 条,是真实信息的 6 倍。关键词集中:福建农业职业技术、Prada、郑州狗主悬赏。

网络区域 / 总览
02 / 突发02 / 08

一条谣言的出现

2023 年 7 月 2 日,一张 Prada 荣宅起火的截图在微博发酵。配文称上海荣宅突发大火,事实是荣宅安然无恙。该谣言获近万次点赞、上千次转发。

网络区域 / 突发
03 / 扩散03 / 08

沉默的转发链条

Prada 火灾谣言的传播拓扑有 160 个节点、203 条关系边。几乎全是单向转发——没有质疑,没有辟谣评论。

网络区域 / 扩散
04 / 主题04 / 08

同步出现的热门话题

同一时期,热门视频主题覆盖 4,876 个账号,其中疑似水军占比 28.5%。同一主题文本被不同账号集中推送,构成值得复核的协同信号。

网络区域 / 主题
05 / 放大者05 / 08

谁在推动扩散?

按水军评分和虚假参与比排序,账号 da1793d8 排在首位——水军评分 0.97,虚假参与比 100%。它参与的 7 条微博全部是虚假信息。

网络区域 / 放大者
06 / 网络06 / 08

代理信号的聚集

大量高 botScore 账号围绕同一时段集中活动,是协调行动的证据。但弱监督标签只是代理信号——这是审计界面,不是判决。

网络区域 / 网络
07 / 细读07 / 08

回到原文

上海静安区的 Prada 荣宅今晚突然发生火灾了!拥有百年历史的荣宅是清末面粉大王荣宗敬的宝邸……——转发近万次。当天 Prada 官方无声明,上海消防无出警记录。

网络区域 / 细读
08 / 边界08 / 08

拓扑不是裁决

一条谣言经过情绪化包装、自动化放大、沉默转发,最终形成集体认知。审计系统的角色是呈现可追溯的证据链,而最终判断需要人来完成。

网络区域 / 边界
04 / 原则

审计姿态

01 / 探索式

探索式 · 非指控

协同模式只能提示哪里值得看,不能证明谁做了什么。每个信号都应被视为问题,而不是结论。

02 / 信号

重信号 · 轻标签

水军分数是弱代理。真正的证据来自突发、热门话题与共享链接。展示结构,把判断权留给分析者。

03 / 代理标签

代理标签 · 非真相

MisBot 的 407,801 个弱标注用户来自推断,并非确认身份。标签需要可见,也必须被标为代理。

04 / 匿名证据

证据 · 已匿名

用户 ID 进入看板前已做 SHA-256 哈希;微博文本被截断。审计关注传播形态,而不是现实身份。

05 / 附录

项目说明

技术栈

  • Next.js 15
  • React 19
  • Tailwind v4
  • Zustand

可视化

  • d3.js v7
  • three.js
  • GSAP + Lenis

字体

  • Bebas Neue
  • IBM Plex Sans
  • IBM Plex Mono

课程

  • 数据可视化
  • 期末项目
  • 2026

审计姿态

  • 探索式
  • 代理信号
  • 非指控

MISBOT 扩散审计 · 2026 课程原型 · 学术使用

水军标签均为代理信号,不构成账号指控。