2023-01-05
排名聚合在社会选择、信息检索、生物信息学等领域有着广泛的应用前景。在许多实际应用中,原始排名信息可能是不精确的、包含噪声的,甚至是被故意干扰的。尽管著名的“孔多塞陪审团定理”表明足够多的个体可以涌现出集体智慧,但在实际情况中,当决策主体不够多的时候,如何做出正确决策仍然是一个难题。在排名聚合领域,一个鲁棒的排名聚合方法应该在排名信息不完美的条件下,仍然能给出稳定可靠的结果。因此,鲁棒性作为排名聚合的理想特征,近年来引起学术界和工业界的广泛关注。然而,以往的大多数研究都是针对随机误差的情况,很少有工作关注恶意干扰下排名聚合方法的鲁棒性。如何建模和分析恶意干扰?排名聚合方法对随机误差和恶意干扰的鲁棒性是否有区别?这些关键问题仍未解决。
近日,复杂系统国际科学中心吴俊教授团队将复杂网络抗毁性研究中的“随机失效”和“故意攻击”概念引入排名聚合领域,创新性地提出了一种针对恶意干扰的排名聚合鲁棒性通用分析框架。该分析框架的核心思想是假设存在一个真实排名作为参考,在此基础上添加恶意干扰生成各种排名数据,并观察排名聚合方法对于恶意干扰的响应。在该分析框架的基础上,研究团队提出了恶意用户比例和恶意干扰强度均可调的实验数据生成方法(如图1-2所示),并将该方法用于比较不同排名聚合方法的鲁棒性。实验结果表明,排名聚合方法对随机误差和恶意干扰的鲁棒性具有很大差异。
图1 不同比例的恶意用户
图2 不同强度的恶意干扰
该工作近期在《Information Sciences》(信息系统领域中科院一区Top期刊,影响因子:8.233)在线发表(https://doi.org/10.1016/j.ins.2023.01.008),论文标题为“Robustness of rank aggregation methods for malicious disturbance”。北京师范大学珠海校区复杂系统国际科学中心为该论文第一完成单位,吴俊教授为通讯作者,博士生陈冬梅为第一作者。该研究得到了国家自然科学基金和广东省自然科学基金的大力支持。