1、信息传播模型
网络信息传播的特点:
网络效应
阵发性
两类信息传播模型
- 阈值模型:线性阈值模型
每个时间步节点被周围节点的影响力的和所激活。
- 级联模型:独立级联模型
被激活的每个节点,有且只有一次机会去尝试激活其未被激活的邻居节点,成功激活的概率各不相同。
节点的影响范围:通过蒙特卡罗模拟得到多次传播的范围,取平均值。
节点传播范围:可以事先通过抛硬币的方式确定每条边是否存在,从而得到传播过程的一个快照网络,取平均值得到传播范围。
2、影响最大化
核心问题:如何选择一组种子节点,获得最大的影响范围?
是一个NP-hard问题
影响最大化的贪心算法
逐个选择边际效益最大的节点加入。
关注对贪心算法的优化。
3、传播网络推断
问题:根据信息传播记录,推断背后的传播网络。
输入:节点u在t时刻被激活
输出:节点u与v之间的传播概率
点对性模型
基本思路:
u在v之前被激活的次数越多,概率越大
u被激活的时刻和t被激活的时刻之间的
时间间隔越小,概率越大。
4、流行度预测
问题:给定一个对象一段时间内的群体关注情况,预测其最终流行度
基于时序分析的预测
基于结构多样性的预测
建模传播过程进行流行度预测:基于自增强泊松过程的流行度预测