为保障软件供应链安全和抢占全球创新制高点,一些国家政府和大型企业大力扶持开源软件。开源软件由于在开发时间、空间、人员和项目管理上的诸多特点而大大增加了开发的复杂性,进而使得开源软件质量具有不确定性。针对这一问题,本书首次聚焦于开源项目资源库挖掘这一主题,展示如何利用大数据驱动方法支持开源软件缺陷管理。本书的内容包括开源软件项目缺陷预测、开源软件项目缺陷分配和开源软件项目缺陷定位。在缺陷预测方面,针对软件缺陷数据的非均衡性、多模态性、稀缺性和时间序列特性开展研究。在缺陷分配方面,针对开源软件缺陷解决过程中的开发人员参与情况和开发人员专长开展研究。在缺陷定位方面,针对开源软件缺陷修改牵涉面大而变更零散的特点开展研究。