京东云与AI 10 篇论文被AAAI 2020 收录,京东科技势力露脸世界舞
本文摘要: 京东云与AI 10 篇论文被AAAI 2020 收录,京东科技实力亮相世界舞台 近年来,人脸解析因其潜在的应用价值而受到了越来越多的关注。论文《A New Dataset and Boundary-Attention Semantic Segmentation for Face Parsing》从人脸解析领域存在的问题出发,在数
京东云与AI 10 篇论文被AAAI 2020 收录,京东科技势力露脸世界舞台 近些年来,人脸解析因其潜在的应用代价而遭到了愈来愈多的重视。论文《A New Dataset and Boundary-Attention Semantic Segmentation for Face Parsing》从人脸解析范畴存在的问题登程,在数据和算法两个方面做出了孝敬。

2月7-12日,AAAI 2020大会在纽约正式拉开前奏,AAAI当做寰球人工智能范畴的顶级学术会议,每一年评审并收录来自寰球最顶尖的学术论文,这些学术研讨引领着技能的趋势和未来。京东云与AI在本次大会上有10篇论文被AAAI收录,触及天然言语办理、核算机视觉、机器借鉴等范畴,充沛展示了京东用技能驱动公司生长的开展模式以及技能势力,技能立异和应用落地同样成为这些论文最招揽行业重视的亮点。

本届会议共收到的有用论文投稿超过8800篇,其间7737 篇论文进入评审环节,最终选取数量为1591篇,选取率为20.6%。京东云与AI共有10篇论文入选AAAI 2020,研讨范畴涵盖人脸辨认、人脸解析、机器浏览明白、文本生成、匹敌样本与模型鲁棒性、智慧城市等前沿的技能研讨范畴,这些能力现在已在市政安防、实体零售、智能客服等事务场景下范围化落地,未来京东云与AI当做值得信任的智能技能提供者,会继续进行技能与事务交融的摸索,这些落地的技能能力也将迎来愈加广大的应用远景。

以下是京东云与AI此次入选10篇论文:

匹敌样本与模型鲁棒性研讨

1.基于Frank-Wolfe框架的高效匹敌攻打算法

A Frank-Wolfe Framework for Efficient and Effective Adversarial Attacks

论文链接:arxiv/pdf/1811.10828.pdf;

依据模型攻打者可获取的信息量来区分,匹敌样本攻打可分为白盒与黑盒两种攻打情势。尽管基于优化的攻打算法如PGD等能够在白盒攻打状况下取得较高的攻打成效率,但它们生成的匹敌样本往往有着较高的失真度。此外,它们相应的黑盒攻打算法通常查问功率较差,需要对被攻打的黑盒模型拜访十分多次才能完成攻打,从而大幅压制了它们的实用性。针对这一问题,京东、弗吉尼亚大学和加州大学洛杉矶分校互助提出了一种基于Frank-Wolfe框架的高效匹敌攻打算法,可活络运用于白盒和黑盒匹敌样本攻打。

作者从理论上证实了所提的攻打算法具有疾速的收敛速率,并在ImageNet和MNIST数据集上验证了所提出算法的性能。比照所有参评的白盒与黑盒攻打基准算法,本文提出的算法在攻打成效率,攻打工夫和查问功率上均显著占优。

2.经过匹敌样本评价序列到序列模型鲁棒性

Seq2Sick: Evaluating the Robustness of Sequence-to-Sequence Models with Adversarial Examples

论文链接:arxiv/pdf/1803.01128.pdf;

使用匹敌样本攻打的难易度来评价深度神经网络的鲁棒性已成为业界常用的办法之一。然而,大大都现有的匹敌攻打算法都集中在基于卷积神经网络的图画分类问题上,由于它的输入空间接连且输出空间有限,便于完成匹敌样本攻打。在本文中,来自京东、加州大学洛杉矶分校和IBM研讨院的研讨者们摸索了一个愈加艰难的问题,即怎么攻打基于循环神经网络的序列到序列(Sequence to Sequence)模型。这一模型的输入是离散的文本字符串,而输出的可能取值则简直是无量的,因而难以设计匹敌攻打方案,在本文之前也未被成功攻破过。为了解决离散输入空间带来的应战,研讨者们提出了断合group lasso和梯度正则化的投影梯度办法。针对近乎无限输出空间带来的问题,他们也设计了一些全新的丧失函数来完成两种新的攻打方式:(1) 非堆叠攻打,即保证模型被攻打后的输出语句与正常状况下的输出语句不存在任何重合,(2)方针要害词攻打,即给定恣意一组要害词,保证模型被攻打后的输出语句包括这些要害词。

最终,研讨者们将算法应用于序列到序列模型常用的两大使命机器翻译和文本摘要中,发现经过对输入文本做轻微的变动,即能够显著扭转序列到序列模型的输出,成功完成了匹敌样本攻打。同时,研讨者们也指出,尽管攻打获得了成功,但与基于卷积神经网络的分类模型相比,序列到序列模型的匹敌攻打难度更大,且匹敌样本更易被发现,因而从匹敌攻打的角度进行度量,序列到序列模型是一种鲁棒性更优的模型。

机器浏览明白

3.多跳多文档浏览明白研讨

Select, Answer and Explain: Interpretable Multi-hop Reading Comprehension over Multiple Documents

论文链接:arxiv/pdf/1911.00484v2.pdf;

可解释的对多文档多跳浏览明白(RC)是一个具有应战性的问题,由于它需要对多个信息源进行推理并经过提供支撑物证来解释答案猜测。《Select, Answer and Explain: Interpretable Multi-hop Reading Comprehension over Multiple Documents》论文中提出了一种可解释的多跳多文档浏览明白的办法,经过设计一个有用的文档淘汰模块和基于图神经网络的推理模块,针对给定问题能够同时精确的找出问题的答案以及支撑答案的物证。

图1. 多跳多文档浏览明白办法示目的

文本生成

4.基于要素感知的多模态电商商品摘要

Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products

论文链接:box.jd/sharedInfo/2926429040ECC7D3;

论文《Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products》中提出了一个基于商品要素的多模态商品信息主动摘要体系,其能够依据商品的文本形容和商品图片主动生成商品营销短文。商品的外观抉择了用户对该商品的第一印象,商品的功用属性最终抉择了用户的购买行为,论文提出的多模态商品信息主动摘要体系能够有用的整合商品的外观和功用信息,主动捕捉到该商品的特色卖点,并为其生成一段简略的营销短文。差别的用户重视的商品要素往往是差别的,好比冰箱的 能耗 和 容量 ,电话的 内存 和 屏幕 。体系以商品要素为切入点,挖掘商品最有卖点的商品要素,并从商品要素维度管束输出文本的信息冗余度、可读性和对输入信息的忠实度,最终生成一段简洁凝练、卖点突出、流畅、合规的商品营销短文,以期待引起潜在购买者的一致。

图2. 模型框架图

5. 基于要害词辅导的生成式句子摘要

Keywords-Guided Abstractive Sentence Summarization

论文链接:box.jd/sharedInfo/B2234BB08E365EEC;

《Keywords-Guided Abstractive Sentence Summarization》论文中提出了一种文本摘要的新办法,即使用输入文本的要害词信息提高了文本摘要模型的质量。论文模拟了人类生成摘要的过程:当人类为某一段文本生成摘要时,起首会对该文本进行浏览,并辨认出里边的要害词,进而经过创作加工,将这些要害词以流畅的言语表白出来。另外,文本摘要和文本要害词抽取在素质上是相通的,即都是在输入文本中提取要害信息,仅仅是输出的情势有所区别。基于上述考虑,论文提出一个多使命借鉴框架,经过一个同享的编码器,相互强化文本摘要和要害词抽取使命。在解码器生成摘要时,使用要害词的信息和原始输入文本进行交互,经过两层注意力和两层仿造机制,在要害词的辅导下,为输入文本生成摘要。

图3. 共挑选编码模型的框架

6.基于多模态信息辅导的多模态摘要

Multimodal Summarization with Guidance of Multimodal Reference

论文链接:box.jd/sharedInfo/36929195FF05B01F;

论文《Multimodal Summarization with Guidance of Multimodal Reference》提出了一种基于多模态信息监视的多模态主动摘要模型,该模型以文本和图片当做输入,生成图文并茂的摘要。传统的多模态主动摘要模型在锤炼过程当中,往往以文本参考摘要的极大似然丧失当做方针函数,而后使用注意力机制来选择与文内幕对应的图片。这种做法轻易带来模态误差的问题,即模型会偏向于优化文本生成的质量而忽视了图片选择的质量。论文提出的模型优化了多模态摘要模型的方针函数,即在文本参考摘要的丧失函数的根底上添加了图片参考摘要的丧失函数。试验发现,在引入了多模态信息监视锤炼后,多模态主动摘要模型的图片选择质量得到了显著的改进,文本生成质量也有所改善,从而能够生成更高质量的图文摘要。

图4. 多模态基准辅导的多模态主动文摘框架图

7.文本到SQL的生成研讨

Zero-shot Text-to-SQL Learning with Auxiliary Task

论文链接:arxiv/pdf/1908.11052.pdf;

近些年来,在Text-to-SQL使命中利用神经Seq2Seq模型获得了高大的成功。可是,极少有研讨重视这些模型怎么推行到实践不可见数据中。论文《Zero-shot Text-to-SQL Learning with Auxiliary Task》经过设计一个有用的辅助使命支撑模型以及生成使命的正则化项,以添加模型的泛化能力。经过在大型文本到SQL数据集WikiSQL上试验评价模型,与强壮的基线粗到精模型相比,论文中打造的模型在整个数据集上的肯定精度比基线提高了3%以上。在WikiSQL的Zero-shot子集测试中,这一模型在基线上取得了5%的肯定精确度增益,分明地证实了其卓越的通用性。

图5. 论文设计的模型示目的

智慧城市研讨

8.车站潜在客流的智能化猜测

Potential Passenger Flow Prediction: A Novel Study for Urban Transportation Development

论文链接:arxiv/pdf/1912.03440.pdf;

跟着城市人口的增多和城市化的不断开展,公共交通东西如地铁正在施展着愈来愈重要的作用。为了让地铁可以施展更大的作用,方便人们出行,需要精准猜测每一个车站在未来的潜在客流量,从而为地铁站的选址和建设范围提供倡议。针对这一问题,京东和悉尼科技大学的研讨者们互助提出了一种多视图部分相关性借鉴办法。其核心理想是使用自习气权重来了解方针地区及其部分地区之间的客流相关性,并经过嵌入一些范畴常识到多视图借鉴过程当中的办法来综合晋升对潜在客流的猜测精确性。

图6:潜在客流猜测问题

图7:模型流程图

文中经过很多的试验结果标明,相比于一些别的猜测算法,论文中提出的办法获得了显著更优的猜测精确性,能够为车站规划和城市智能化建设提供更为有力的保障。此外,文中所提的思路也对解决保举体系中的冷启动问题提供了一定的学习含义。

人脸辨认

9.基于分错特援引导的丧失函数

Mis-classified Vector Guided Softmax Loss for Face Recognition

论文链接:arxiv/pdf/1912.00833.pdf;

在人脸辨认范畴,各个场景下的应用对算法能力提出了更高的要求。人脸辨认的范围已从本来的千人、万人级增大到百万人乃至千万人。现在研讨面对的一大应战是在辨认范围愈来愈大的场景下,怎么在较低的误识率的同时保持辨认经过率。现有的人脸辨认干流锤炼算法主要归类为margin-based和mining-based两大类,但都存在各自的办法上的毛病。论文《Mis-classified Vector Guided Softmax Loss for Face Recognition》就针对怎么让模型借鉴得到判别能力更优良的人脸特征,研讨了一种新的人脸辨认锤炼算法,使用论文中提出的Mis-classified Vector Guided Softmax,可以同时优化现有办法存在的毛病,而且协助辨认网络在锤炼过程当中取得更有针对性的难例强调,完成更据辨别能力的模型锤炼。论文的办法在现在多个公然人脸辨认测试集上验证了有用性,而且辨认精度超过了现有的办法。

图8. MV-Softmax特征的几何解释

人脸解析

10.数据库和一种边沿感知的语义切割办法

A New Dataset and Boundary-Attention Semantic Segmentation for Face Parsing

论文链接:box.jd/sharedInfo/C1BEAD9CBDB50DA3;

近些年来,人脸解析因其潜在的应用代价而遭到了愈来愈多的重视。论文《A New Dataset and Boundary-Attention Semantic Segmentation for Face Parsing》从人脸解析范畴存在的问题登程,在数据和算法两个方面做出了孝敬。起首,论文提出了一种高效的像素级的人脸解析数据标注框架,该框架极大的贬低了数据的标注难度,使他们在短期内构建了一个大范围的人脸解析数据集(LaPa)。该数据集包括了超过22,000张人脸图片,且掩盖了多种样子、光照和表情变化。同时,本文还提出了一种有用的鸿沟注意力的语义切割办法(BASS),该办法从网络结构和丧失函数两方面动手,充沛使用图画的鸿沟信息来晋升语义切割精度,论文中设计了很多的试验来验证该办法的有用性,同时该办法获得了公然数据集Helen上SOTA的性能。

图9.BASS的网络结构示目的

从这些前沿的研讨后果不难看出,京东云与AI正致力于将语音语义、核算机视觉、机器借鉴等技能在商品保举、实体零售等范畴继续落地应用,不只注重技能的先进性,更注重应用的可信任。始终以来京东云与AI致力于践行可信任的AI, 可信任的AI 不是标语,也不只仅是代价观层面。它有六个维度,公道、鲁棒性、代价对齐、可复制、可解释和负职责,此次入选论文中就包括着对 匹敌样本与模型鲁棒性 的研讨。一壁是对技能的高大应战,一壁是人文精力,成为最值得信任的智能技能提供者正是京东云与AI执着谋求的社会职责与代价表现。

2019年8月,以NeuHub京东人工智能开放平台为载体,京东入选智能供给链国家人工智能开放平台,依附这一平台的技能堆集,京东云与AI在疫情期间疾速推出应急资源信息颁布平台,上线半个月工夫即协助湖北、武汉及别的疫情波及区域供给医疗类、消毒类、日子类等各类救援物资超过2.6亿件,供给药品超过4亿盒。其间包括各类口罩1.5亿只、护目镜40.6万个、防护服鞋套283.72万套等抗疫必需品;基于京东云与AI当先的语音语义技能研发的智能疫情助理,已在北京、山东、安徽、江苏、江西、四川等地的十多个行业、一千余家组织和机构中疾速落地,免费提供疫情征询效劳,累计效劳征询数量达数百万条。切实让民众在疫情这一不凡时期感遭到技能带来的暖和和便当。

2019年,京东在云、AI、IoT等技能范畴和事务的摸索实现了京东云与AI在ABCDE技能战略的布局。这个战略是大家技能上深度交融,交融AI(人工智能)、Big Data()、Cloud()、Devices(IoT)和Exploration(前沿摸索)对外赋能,为财产交融、科技立异,提供最坚实、最前沿、最可信任的根底设备和效劳。

京东云与AI总裁、京东集团技能委员会主席周伯文博士表示,京东技能战略 ABCDE 的素质是促成技能交融带来的代价叠加,经过前沿技能的研发,与行业Know-how进一步严密结合,与互助同伴一道共建杰出的技能互助生态,并时刻要以用例为中间,用京东云与AI的技能堆集对外赋能,解决实在场景问题,以最终完成面向社会发明更多代价。

怎么进行技能和财产的交融始终是AI行业和企业重视的重点。2020年,京东云与AI当做 技能输出 的先行者,他的身影还将在更多的寰球顶级学术、科技大会上呈现,并继续深耕技能与实体经济的交融,摸索技能的鸿沟与应用代价,推进产学研用的一体化建设。京东云与AI也将持续用扎实的技能堆集对外赋能,与社会各界一同发明并见证云智联世界、财产互联网繁荣开展的新年代!

相关浏览: