今日 Paper | 3D手势估计；自学习机器人；鲁棒语义分割；卷积神经网络；混合高斯过程等

本文作者： AI研习社

2020-01-08 14:50

导语：每天都为你精选关于人工智能的前沿学术论文供你学习参考。

为了帮助各位学术青年更好地学习前沿研究成果和技术，AI科技评论联合Paper 研习社（paper.yanxishe.com），重磅推出【今日 Paper】栏目，每天都为你精选关于人工智能的前沿学术论文供你学习参考。以下是今日的精选内容——

Self learning robot using real-time neural networks
Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
Data Structure Primitives>
HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
From 'F' to 'A'>
Information Theoretic Model Predictive Q-Learning

使用实时神经网络的自学习机器人

论文名称：Self learning robot using real-time neural networks

作者：Gupta Chirag /Nangia Chikita /Kumar Chetan

发表时间：2020/1/6

论文链接：https://paper.yanxishe.com/review/8314?from=leiphonecolumn_paperreview0108

推荐理由：随着高容量，低精度计算技术的发展以及认知人工智能启发式系统的应用研究，通过具有实时学习功能的神经网络的机器学习解决方案引起了研究界以及整个行业的极大兴趣。

本文涉及对神经网络的研究，开发和实验分析，该神经网络在带有手臂的机器人上实现，通过该机器人的进化可以学习直线或根据需要行走。神经网络使用梯度下降和反向传播算法进行学习。神经网络的实现和训练均在树莓派pi 3上的机器人上本地完成，因此其学习过程是完全独立的。首先在MATLAB上开发的自定义模拟器上对神经网络进行测试，然后在树莓派计算机上对其进行实现。存储每一代不断发展的网络中的数据，并对数据进行数学和图形分析。分析了学习率和容错度等因素对学习过程和最终输出的影响。

今日 Paper | 3D手势估计；自学习机器人；鲁棒语义分割；卷积神经网络；混合高斯过程等

从3D MRI 进行脑肿瘤区域的鲁棒语义分割

论文名称：Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs

作者：Myronenko Andriy /Hatamizadeh Ali

发表时间：2020/1/6

论文链接：https://paper.yanxishe.com/review/8316?from=leiphonecolumn_paperreview0108

推荐理由：多模式脑肿瘤分割挑战（BraTS）将研究人员召集起来，以改进3D MRI脑肿瘤分割的自动化方法。肿瘤分割是疾病诊断和治疗计划所必需的基本视觉任务之一。得益于现代GPU的出现，前几年获胜的方法都是基于深度学习的，可以快速优化深度卷积神经网络体系结构。

在这项工作中，作者探索了3D语义分割的最佳实践，包括常规的编码器-解码器体系结构以及组合的损失函数，以试图进一步提高分割的准确性。作者评估了BraTS 2019挑战赛的方法。

从卷积神经网络的架构特征推断出其准确性

论文名称：Inferring Convolutional Neural Networks' accuracies from their architectural characterizations

作者：Hoang D. /Hamer J. /Perdue G. N. /Young S. R. /Miller J. /Ghosh A.

发表时间：2020/1/7

论文链接：https://paper.yanxishe.com/review/8311?from=leiphonecolumn_paperreview0108

推荐理由：卷积神经网络（CNN）在分析来自许多领域（包括粒子成像探测器）的科学数据方面显示出了巨大的希望。但是，对于特定的应用程序和不同的数据集选择合适的网络体系结构（深度，内核形状，激活功能等）的挑战仍然知之甚少。

在本文中，作者通过提出一种系统的语言来研究CNN的体系结构与其性能之间的关系，该语言对于训练之前的不同CNN的体系结构之间的比较很有用。通过不同的属性来表征CNN的体系结构，并证明这些属性可以预测两个特定的基于计算机视觉的物理问题中的网络性能-事件顶点发现和费米国家加速器实验室的MINERvA实验中的强子多重性分类。为此，作者从针对物理问题的优化网络架构中提取了几种架构属性，这些属性是一种称为多节点深度学习神经网络的模型选择算法（MENNDL）的输出。作者使用机器学习模型来预测网络在训练之前是否可以比某个阈值精度更好地运行。

与随机猜测相比，模型的执行效果要好16-20％。此外，作者在大量网络的准确性回归中发现普通最小二乘模型的确定系数为0.966。

分层强化学习作为人类任务交织的模型

论文名称：Hierarchical Reinforcement Learning as a Model of Human Task Interleaving

作者：Gebhardt Christoph /Oulasvirta Antti /Hilliges Otmar

发表时间：2020/1/4

论文链接：https://paper.yanxishe.com/review/8313?from=leiphonecolumn_paperreview0108

推荐理由：人们如何决定一项任务要持续多长时间，何时切换以及执行另一项任务？理解支持任务交错的机制是认知科学的一个长期目标。先前的工作提出了贪婪的启发法和最大化边际收益率的政策。然而，目前尚不清楚这种策略如何适应于提供多种任务，转换成本昂贵且回报延迟的日常环境。

在这里，作者开发了由强化学习（RL）驱动的监督控制的分层模型。主管级别使用特定于任务的近似效用估计值学习切换，这些估计值是在较低级别上计算的。即使在具有多个任务以及任意和不确定的报酬和成本结构的条件下，也可以从经验中学到分层的最优价值函数分解。该模型再现了任务交错的已知经验效果。与六任务问题（N = 211）中的近视基线相比，它可以更好地预测个人数据。结果支持分层RL作为任务交织的合理模型。

鲁棒经济模型预测控制的混合高斯过程方法

论文名称：A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control

作者：Rostam Mohammadreza /Nagamune Ryozo /Grebenyuk Vladimir

发表时间：2020/1/7

论文链接：https://paper.yanxishe.com/review/8308?from=leiphonecolumn_paperreview0108

推荐理由：为了减少控制器的保守性，本文提出了一种混合高斯过程（GP）方法，用于在未知未来扰动下进行鲁棒的经济模型预测控制。提出的混合GP是两种已知方法的组合，即核成分和非线性自回归。在分析预测结果之后，采用切换机制来选择这些方法中的一种来进行干扰预测。混合GP旨在通过使用过去的干扰测量来检测模式，而且还检测未知干扰中的意外行为。

在混合GP中还使用了一种新颖的遗忘因子概念，可以减轻较旧的测量的权重，从而基于最近的干扰值提高预测精度。}检测到的干扰信息用于减少预测的不确定性。经济模型的预测控制器。仿真结果表明，与其他基于GP的方法相比，在扰动具有可识别模式的情况下，该方法可以提高经济模型预测控制器的整体性能。

事实检测URL推荐的属性多关系注意力网络

论文名称：Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation

作者：You Di /Vo Nguyen /Lee Kyumin /Liu Qiang

发表时间：2020/1/7

论文链接：https://paper.yanxishe.com/review/8309?from=leiphonecolumn_paperreview0108

推荐理由：为了打击假新闻，研究人员主要致力于发现假新闻，而新闻工作者则建立并维护了事实检查网站（例如，此URL（https://www.snopes.com/）和此 URL（https://www.politifact.com/））。但是，通过社交媒体网站大大促进了虚假新闻的传播，并且这些事实检查网站还没有得到充分利用。

为了克服这些问题并补充现有的伪造新闻方法，本文提出了一种基于深度学习的事实检查URL推荐器系统，以减轻伪造新闻在诸如Twitter和Facebook等社交媒体网站上的影响。特别是，作者提出的框架由一个多关系注意模块和一个异构图注意力网络组成，以学习用户URL对，用户对用户对和URL URL对之间的复杂/语义关系。在真实数据集上进行的大量实验表明，我们提出的框架优于八个最新的推荐模型，至少提高了3〜5.3％。

持久内存的数据结构原语：一种评估

论文名称：Data Structure Primitives>作者：Götze Philipp /Tharanatha Arun Kumar /Sattler Kai-Uwe

发表时间：2020/1/7

论文链接：https://paper.yanxishe.com/review/8310?from=leiphonecolumn_paperreview0108

推荐理由：永久内存（PM），例如已经可用的Intel Optane DC永久性存储器的技术代表了一种非常有前途的下一代存储器解决方案，对数据库体系结构具有重大影响。已经提出了这项新技术的几种数据结构及其特性。但是，基本上只提出并评估了完整的结构，掩盖了个人想法和PM特征的影响。

因此，在本文中，我们将分解目前为止介绍的结构，识别其基础设计原语，并将其分配给有关PM的适当设计目标。在真实的PM硬件上进行全面实验的结果是，作者能够在微观水平上揭示基元的取舍。由此，可以导出所选图元的性能配置文件。有了这些，就可以精确地确定其最佳用例以及漏洞。除了对基于PM的数据结构设计的一般见解之外，作者还发现了迄今为止文献中尚未考虑的新的有希望的组合。

HandAugment：一种用于HANDS19挑战任务1-基于深度的3D手势估计的简单数据增强方法

论文名称：HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation

作者：Zhang Zhaohui /Xie Shipeng /Chen Mingxiu /Zhu Haichao

发表时间：2020/1/3

论文链接： https://paper.yanxishe.com/review/8175?from=leiphonecolumn_paperreview0108

推荐理由：这篇论文考虑的是3D景深图像中预估手势的问题。

这篇论文提出了一个简单的数据增强方法HandAugment，包含两阶段的神经网络学习：第一阶段在迭代的模式下抽取手部图像块，并根据深度图预估手的初始姿态，过滤掉噪音图块（例如背景与手臂）。被抽取出的图块与初始化手部姿态被代入第二阶段的神经网络，以获取最终的手部姿态。

这种两阶段策略极大提升了手势识别的准确率，并在HANDS19挑战任务1-基于景深的3D手势识别大赛上获得了第一名。

纽约摄政科学考试从“ F”到“ A”：Aristo项目概述

论文名称：From 'F' to 'A'>作者：Clark Peter /Etzioni Oren /Khashabi Daniel /Khot Tushar /Mishra Bhavana Dalvi /Richardson Kyle /Sabharwal Ashish /Schoenick Carissa...

发表时间：2019/9/4

论文链接：https://paper.yanxishe.com/review/7846?from=leiphonecolumn_paperreview0108

推荐理由：人工智能已经在国际象棋，围棋和扑克，甚至《危险》等游戏上获得了非凡的掌握，但是各种各样的标准化考试仍然是一个巨大的挑战。即使在2016年，最好的AI系统在8年级科学考试挑战中也仅达到59.3％。

这篇论文报道了在纽约8年级摄政科学考试中取得了空前的成功，该系统首次在该考试的非图表多项选择（NDMC）问题上得分超过90％。此外，基于最近的语言模型的成功，我们的Aristo系统在相应的12年级科学考试NDMC问题上超过了83％。在看不见的测试问题上得出的结果在不同的测试年份和这种测试的不同变体中都是可靠的。他们证明了现代的NLP方法可以精通此任务。虽然不是一般问题解答的完整解决方案（问题是多项选择，并且领域仅限于8年级科学），但它代表了该领域的重要里程碑。

信息理论模型预测Q学习

论文名称：Information Theoretic Model Predictive Q-Learning

作者：Bhardwaj Mohak /Handa Ankur /Fox Dieter /Boots Byron

发表时间：2019/12/31

论文链接：https://paper.yanxishe.com/review/8312?from=leiphonecolumn_paperreview0108

推荐理由：当可以廉价地收集经验时，无模型强化学习（RL）算法可以很好地解决顺序决策问题；当可以准确地建模系统动力学时，基于模型的RL有效。但是，这两个假设在诸如机器人技术之类的现实世界问题中都可能违背，在这种情况下，查询系统的成本可能过高，而现实世界的动力学可能难以准确建模。尽管模拟到真实的方法（例如域随机化）试图减轻有偏模拟的影响，但它们仍然会遭受优化挑战（例如局部最小值和针对随机化的手工设计分布），从而难以学习准确的全局值函数或直接转移到现实世界的政策。

与RL相反，模型预测控制（MPC）算法使用模拟器在线优化简单的策略类，从而构建可以有效应对现实世界动态变化的闭环控制器。MPC性能通常受模型偏差和优化范围有限等因素的限制。

在这项工作中，作者提出了信息理论MPC与熵正则化RL之间的新型理论联系，并开发了一种可利用偏差模型的Q学习算法。我们验证了在Sim-to-sim控制任务上提出的算法，以证明优化控制和从头开始强化学习的改进。我们的方法为系统地在真实机器人上部署强化学习算法铺平了道路。