大数据平台由于管理复杂、安全机制不健全导致平台上的大数据面临相当大的安全风险。近年来SQL注入攻击、差分攻击、重标识攻击、数据删除、数据泄露、加密勒索攻击等多种安全威胁,导致的数据泄露、滥用或不可用等数据安全事件不断涌现。
针对数据安全问题,日志审计分析是一种非常有效的风险应对手段,基于大数据平台日志、安全设备日志和平台网络流量等多源异构数据进行分析,可有效实现攻击行为的发现或预测,并进行溯源,保护企业或组织内部数据安全。

赛题任务
根据赛题提供的无标签大数据平台日志数据,参赛队利用机器学习、深度学习,UEBA等人工智能方法,构建系统用户使用大数据平台的行为基线和数据安全事件识别及分类模型。
(1)本赛题初赛任务中,参赛团队将设计算法对大数据平台日志正常行为和数据安全事件进行分类。
(2)本赛题复赛任务中,参赛团队将进一步设计算法对大数据平台日志正常行为和六类安全事件(SQL注入攻击、差分攻击、重标识攻击、数据删除、数据泄露、加密勒索攻击)进行分类。