800-8861133 | 028-62386222
返回
返回

Westone here

网络空间因我们而安全

卫士通荣获2020 KDD Cup佳绩

万象城(中国):2020-06-16来源:卫士通作者:卫士通

03.png

素有“数据挖掘的世界杯”之称的KDD Cup(国际知识发现和数据挖掘竞赛跨模态信息检索大赛)是当今该领域水平最高、影响力最大的全球顶级赛事。该比赛从 1997 年起每年举办一次,吸引了无数来自世界数据挖掘领域的顶尖专家、学者和工程师参赛,是全球顶尖AI团队的必争之地。为了充分检验自身在跨模态数据检索和识别技术中的水平,并与全球最先进的团队进行学习交流,卫士通报名参加了KDD Cup 2020 Challenges for Modern-E-Commerce Platform:Multimodalities Recall,并在激烈的角逐中披荆斩棘荣获第6名的好成绩。


02.png


KDD Cup 2020跨模态信息检索大赛决赛排行榜

卫士通一直致力于以“数据分级分类”为核心的数据安全治理关键技术突破和产品研发工作。基于数据内容的敏感数据识别和定级是其中的关键点之一,跨模态的数据识别技术则是其重中之重。通过跨模态数据识别,可最终实现对混杂了文本、图片甚至音频或视频的多模态复杂数据进行自动化的识别和定级。


本次比赛的赛题是根据一条文本,从多张候选图片中检索出与之最匹配的图片,可以理解为“以文搜图”,这是跨文本与图像两种模态的信息识别与检索。跨模态信息检索是计算机视觉、自然语言处理、大数据等的交叉领域,与之相关的还有跨音频、视频等模态的检索任务。实际上,在我们平时使用浏览器搜索图片和视频,以及网上购物时用关键字搜索商品的过程中都能看到跨模态检索技术的影子。

01.png

卫士通的参赛代表各尽所能,从算法模型的结构、数据扩充、目标函数等方面充分挖掘改进模型的可能性。然而,比赛提供的模型数据有300万条之多,要在如此庞大的数据上训练一个模型至少需要2天的时间,而验证改进思路的可行性还需要设计大量严谨的对比实验。因此,整个比赛的过程不仅是经验和智慧的竞争,更是一场和时间的赛跑。终于,经过两个月的激烈角逐,卫士通在决赛中的正确率达到了79%,在共同参赛的1432支队伍中突出重围,取得了喜人的成绩。


通过本次比赛,不仅展现了卫士通在跨模态数据检索领域的技术实力,也为今后在跨模态场景下数据识别的进一步探索给予了宝贵的经验和充足的信心。而这些来之不易的技术成果,卫士通也将应用在诸如数据脱敏系统和数据安全治理平台等一系列数据分级分类、安全治理的相关产品和方案中,以便为广大用户提供更加智能、精准、高效的服务,并为大数据场景下的数据有序和安全流动提供更加有力的保障。