1.11个数据文件夹,其中 Hadoop, Spark, Windows, Linux, Apache, Thunderbird 是从自己实验室的真实系统中得到的;BGL, HPC, HDFS, Zookeeper, Proxifier 来自其他论文。
2.以2kBGL为例,rawlog.log 是未加工的原始数据;加工后的所有的 event template 在 templates.txt 中展示,每种 event template 的具体日志信息在对应标号的 templateNUMBER.txt 中。