MISBOT — 微博水军与虚假信息扩散审计

审计

微博水军与虚假信息扩散审计

面向微博虚假信息扩散与水军参与的探索式可视分析。系统呈现协同信号，不对账号作定罪式判断。

进入看板数据说明

v.0.6 / 课程原型

01 / 数据集

来源与规模

编号 01MisBot · 2024

23,622 条信息实例

覆盖虚假信息、已核验信息与热点声明的微博信息实例。

编号 02942,430 名传播参与者

扩散边

每一次转发、评论或态度反馈都会进入传播结构。

编号 0399,874 个标注用户

用户标签

核心用户集合含人工标注的水军/真人/未知标签；其余为弱代理信号。

编号 04证据已哈希

匿名文本

用户 ID 经 SHA-256 哈希；证据文本被截断，不提交原始账号名。

编号 05探索式框架

信号，不是定罪

水军分数只是代理指标，系统不会指控任何账号具有恶意。

正在加载叙事网络...

02 / 案例研究

背景网络审计

01 / 总览01 / 08

2023 年夏天的异常信号

2023 年 4 月至 8 月，微博虚假信息量骤增。6 月单月假新闻 1,605 条，是真实信息的 6 倍。关键词集中：福建农业职业技术、Prada、郑州狗主悬赏。

网络区域 / 总览

02 / 突发02 / 08

一条谣言的出现

2023 年 7 月 2 日，一张 Prada 荣宅起火的截图在微博发酵。配文称上海荣宅突发大火，事实是荣宅安然无恙。该谣言获近万次点赞、上千次转发。

网络区域 / 突发

03 / 扩散03 / 08

沉默的转发链条

Prada 火灾谣言的传播拓扑有 160 个节点、203 条关系边。几乎全是单向转发——没有质疑，没有辟谣评论。

网络区域 / 扩散

04 / 主题04 / 08

同步出现的热门话题

同一时期，热门视频主题覆盖 4,876 个账号，其中疑似水军占比 28.5%。同一主题文本被不同账号集中推送，构成值得复核的协同信号。

网络区域 / 主题

05 / 放大者05 / 08

谁在推动扩散？

按水军评分和虚假参与比排序，账号 da1793d8 排在首位——水军评分 0.97，虚假参与比 100%。它参与的 7 条微博全部是虚假信息。

网络区域 / 放大者

06 / 网络06 / 08

代理信号的聚集

大量高 botScore 账号围绕同一时段集中活动，是协调行动的证据。但弱监督标签只是代理信号——这是审计界面，不是判决。

网络区域 / 网络

07 / 细读07 / 08

回到原文

上海静安区的 Prada 荣宅今晚突然发生火灾了！拥有百年历史的荣宅是清末面粉大王荣宗敬的宝邸……——转发近万次。当天 Prada 官方无声明，上海消防无出警记录。

网络区域 / 细读

08 / 边界08 / 08

拓扑不是裁决

一条谣言经过情绪化包装、自动化放大、沉默转发，最终形成集体认知。审计系统的角色是呈现可追溯的证据链，而最终判断需要人来完成。

网络区域 / 边界

04 / 原则

审计姿态

01 / 探索式

探索式 · 非指控

协同模式只能提示哪里值得看，不能证明谁做了什么。每个信号都应被视为问题，而不是结论。

02 / 信号

重信号 · 轻标签

水军分数是弱代理。真正的证据来自突发、热门话题与共享链接。展示结构，把判断权留给分析者。

03 / 代理标签

代理标签 · 非真相

MisBot 的 407,801 个弱标注用户来自推断，并非确认身份。标签需要可见，也必须被标为代理。

04 / 匿名证据

证据 · 已匿名

用户 ID 进入看板前已做 SHA-256 哈希；微博文本被截断。审计关注传播形态，而不是现实身份。

05 / 附录

项目说明

数据集

技术栈

Next.js 15
React 19
Tailwind v4
Zustand

可视化

d3.js v7
three.js
GSAP + Lenis

字体

Bebas Neue
IBM Plex Sans
IBM Plex Mono

课程

数据可视化
期末项目
2026

审计姿态

探索式
代理信号
非指控

MISBOT 扩散审计 · 2026 课程原型 · 学术使用

水军标签均为代理信号，不构成账号指控。