0
本文作者: 丛末 | 2019-05-10 19:04 | 专题:IJCAI 2019 |
雷锋网 AI 科技评论按:作为人工智能领域最顶级的国际学术会议之一,IJCAI 今日公布了最终论文接收结果,引起了该领域的密切关注。据悉,IJCAI 2019 今年一共收到 4752 篇有效提交论文,最终的论文收录数量为 850 篇,接收率为 17.9% 。虽然今年论文投稿量与收录量比去年(论文投稿量为 3470 篇、收录量为 710 篇)都要高,但最终的接收率要比去年的 20.5% 低不少。
论文收录结果出炉后,有人欢喜有人愁:一方面,各位落选者先后抒发了自己的遗憾;而另一方面,各位论文被收录的实力派也纷纷晒出了自己收到的论文收录通知。针对大家在 IJCAI 2019 论文收录方面的更多疑问,后续雷锋网 AI 科技评论会在 IJCAI 2019 程序委员会主席(Sarit Kraus)的专访中为大家带来答案。而在此之前,我们不妨先来温习一下 IJCAI 近 20 年以来摘得「杰出论文奖」(Distinguished Paper Award)的二十九篇论文,并从这些最佳论文中一窥 AI 这些年来的发展轨迹。
SentiGAN:通过混合对抗性网络生成情感文本
SentiGAN: Generating Sentimental Texts via Mixture Adversarial Networks
论文摘要:在自然语言生成领域,生成不同情感标签的文本越来越多受到关注。近来,生成式对抗网络(GAN)在文本生成中表现出色。然而,通过 GAN 生成的文本往往在面临质量差、缺乏多样性和模式崩溃(mode collapse )的问题。在这篇论文中,我们提出了一个新的框架——SentiGAN,包含有多个生成器和一个多类别判别器,以解决上述问题。在该框架中,多个生成器同时训练,旨在无监督环境下产生不同情感标签的文本。我们提出了一个基于惩罚的目标函数,使每个生成器都能在特定情感标签下生成具有多样性的样本。此外,使用多个生成器和一个多类判别器,可以使每个生成器专注于准确地生成自己的特定情感标签的例子。在四个数据集上的实验结果表明,我们的模型在情感准确度和生成文本的质量方面始终优于当前几种最先进的文本生成方法。
论文地址:https://www.ijcai.org/proceedings/2018/0618.pdf
通过大多数动态对观点传播中的共识形成进行推理
Reasoning about Consensus when Opinions Diffuse through Majority Dynamics
论文摘要:该论文研究了社会图上的意见传播问题。在社会图中,智能体持有二元意见,并且社会压力导致他们遵从大多数邻居所表示的意见。在这种背景下,考虑有关少数/多数是否能够将其支持的意见传播到所有其他智能体的问题。研究结果表明,无论底层图如何,总是存在一个由半数智能体组成的群体可以消除相反的意见。相反地,少数群体的影响力取决于给定图的某些特征,这些特征的识别便是 NP 难问题(NP-hard)。而决定这两种观点是否可以在某种稳定的配置中共存也是 NP 难的。
论文地址:https://www.ijcai.org/proceedings/2018/0007.pdf
R-SVM+:具有私有信息的鲁棒学习
R-SVM+: Robust Learning with Privileged Information
论文摘要:在实际应用场景中,训练数据和测试数据质量的干净度往往难以让人满意。由于缺少解决数据中潜在噪声的有效策略,现有方法的效果在特权信息学习(learning using privileged information,LUPI)范式中可能面临很大的挑战。本文基于严格的理论分析,提出了一种新的鲁棒 SVM+(R-SVM+)算法。我们在 SVM+ 框架下的 LUPI 范式中研究了样本标签数据和特权标签数据的扰动下界,这个扰动下界会误导模型做出错误的决策。通过最大化下界,学到的模型在扰动下的容忍度将会增大。据此,我们给模型引入了新的正则化函数,用于升级 SVM+ 的变体。将 R-SVM+ 的目标函数转化为二次规划问题,利用现成的求解方法可以很容易进行优化求解。实证结果展现了 R-SVM+ 的必要性和算法的有效性。
论文地址:https://www.ijcai.org/proceedings/2018/0334.pdf
在基于领域本体的查询中,从连接性查询到实例查询
From Conjunctive Queries to Instance Queries in Ontology-Mediated Querying
论文摘要:我们考虑基于 ALC 族和连接查询的表达性描述逻辑的本体中介查询(ontology-mediated queries,OMQs),研究基于实例查询(instance queries,IQs)的 OMQ 的可重写性。我们的结果包括这种重写何时能精确表征以及决定重写性的严格复杂性界限。我们还给出了判定给定 MMSNP 语句是否等价于 CSP 的相关问题的严格复杂度界限。
论文地址:https://www.ijcai.org/proceedings/2018/0250.pdf
玩的是什么游戏?从游戏中的正态与拓展性端到端学习
What Game are We Playing? End-to-end Learning in Normal and Extensive from Games
论文摘要:虽然人工智能最近的研究在求解大型、零和、扩展形式的博弈方面取得了很大进展,但过去大多数工作中的基本假设都是博弈本身的参数是智能体已知的。本文讨论相对未被充分探索但同样重要的「逆」设置,其中并不是所有智能体都知道底层博弈的参数,它们必须通过观察来学习。我们提出一个可微的、端到端的学习框架来处理这个任务。特别地,我们考虑博弈的正则化版本,等价于随机最优反应均衡(quantal response equilibrium)的特定形式,并改进:1) 在正规形式博弈和扩展形式博弈中寻找这种平衡点的原始-对偶牛顿(primal-dual Newton)方法;2) 反向传播方法使我们能够通过解本身来计算所有相关博弈参数的梯度。这最终让我们通过端到端的训练来学习博弈,通过将「可微的博弈求解器」有效地集成到更大的深层网络体系结构的循环中。我们展示了该学习方法在多种设置中的有效性,包括扑克和安全博弈任务。
论文地址:https://www.ijcai.org/proceedings/2018/0055.pdf
图注意力机制的带有常识知识的对话生成
Commonsense Knowledge Aware Conversation Generation with Graph Attention
论文摘要:常识知识对于许多自然语言处理任务来说至关重要。本文提出了一种新的开放领域会话生成模型,以展示大规模常识知识如何促进语言理解和生成。在给定用户帖子的情况下,模型从知识库中检索相关知识图,然后用静态图注意力机制对图进行编码,以增强帖子的语义信息,从而支持对帖子的更好理解。之后,在单词生成过程中,该模型通过动态图注意力机制仔细地读取检索到的知识图和每个图中的知识三元组,以便于更好地生成。这是第一次尝试在对话生成中使用大规模常识知识。此外,与现有模型分别和独立地使用知识三元组(实体)不同,我们的模型将每个知识图作为一个整体来处理,从而在图中编码更结构化、连接的语义信息。实验表明,该模型能够产生比现有基准更合适、信息量更大的响应。
论文地址:https://www.ijcai.org/proceedings/2018/0643.pdf
图相似性的简并框架
A Degeneracy Framework for Graph Similarity
论文摘要:精确测量图形之间的相似性是许多学科应用的核心问题。大多数现有的确定图相似性的方法要么关注图的局部性质,要么关注图的全局性质。然而,即使从局部或全局的角度来看,图形看起来非常相似,但它们可能在不同的尺度上表现出不同的结构。本文提出了一个通用的图相似性框架,该框架考虑了多个不同尺度上的结构。该框架利用图的 k 核(k-core)分解来构建嵌套子图的层次结构。应用该框架导出了四种图核(graph kernels)的变体:图核、最短路径核、Weisfeiler-Lehman 子树核和金字塔匹配图核。该框架不仅限于图核,而是可以应用于任何图比较算法。该框架在多个用于图分类的基准数据集上进行了评估。在大多数情况下,基于核的内核在分类精度方面比基本内核有显著的提高,而它们的时间复杂度仍然非常优秀。
论文地址:https://www.ijcai.org/proceedings/2018/0360.pdf
使用限制 Datalog 程序进行声明性数据分析的基本原理
Foundations of Declarative Data Analysis Using Limit Datalog Programs
论文摘要:受声明性数据分析应用的启发,我们研究了 Datalogℤ,这是一个带有整数运算功能的实际数据记录(positive Datalog)的扩展。这一语言被认为是不可判定的,因此我们提出了两个分段。在 limit Datalogℤ 中,谓语被公理化以保持最小/最大数值,从而允许我们表明事实蕴含(fact entailment)是结合中的完整 coNExpTime 和数据复杂性中的完整 coNP。此外,额外的稳定性需求致使复杂性分别降至 ExpTime 和 PTime。最终,我们证明稳定的 Datalogℤ 能够表达很多有用的数据分析任务,因此我们的研究成果为高级信息系统的发展打下了坚实的基础。
论文地址:https://www.ijcai.org/proceedings/2017/0156.pdf
一般游戏玩法中的基于约束的对称性检测
Constraint-Based Symmetry Detection in General Game Playing
论文摘要:对称检测有望成为减少游戏搜索树的一种方法。在一般游戏玩法(GGP)中,任何游戏由游戏描述语言(GDL)中的一组规则紧凑地表示,用于对称检测的最先进的方法依赖于与 GDL 描述相关联的规则图的游戏。虽然这种基于规则的对称检测方法可以应用于各种树搜索算法,但它们仅涵盖在 GDL 描述中显而易见的有限数量的对称性。在本文中,我们开发了利用约束编程技术的随机游戏中的对称检测的替代方法。GDL 游戏中的极小值优化问题被当做随机约束满足问题(SCSP),可以将其视为一级 SCSP 序列。Minimax 对称性根据这些一阶约束网络的微结构补充推断。基于这种方法的理论分析,我们实验性地展示了随机约束求解器 MAC-UCB 结合基于约束的对称性检测,要显著优于标准的蒙特卡洛树搜索算法与基于规则的对称检测的结合。这种约束驱动的方法也通过我们的 AI 在最后一次 GGP 比赛中获得的出色成绩得到验证。
论文地址:https://www.ijcai.org/proceedings/2017/0040.pdf
通过知识片段迁移来实现一般异构迁移的距离度量学习
General Heterogeneous Transfer Distance Metric Learning via Knowledge Fragments Transfer
论文摘要:迁移学习旨在通过利用其他相关任务的信息(或迁移知识)来提高目标学习任务的表现。近来,迁移距离度量学习(TDML)吸引了很多研究者的兴趣,但是大多数这些方法假设源和目标学习任务的特征表示是一样的。因此,它们不适用于数据来自异构域(特征空间,模态甚至语义)的应用程序。虽然一些现有的异构传输学习(HTL)方法能够处理这样的问题,但它们在实际应用中缺乏灵活性,而学习的转换通常被限制为线性的。因此,我们开发了基于知识片段的通用和灵活的异构 TDML(HTDML)框架迁移策略。在我们提出的 HTDML 中,可以使用任何(线性或非线性)距离度量学习算法来预先学习源度量。然后,从预先学习的源度量中提取一组知识片段,帮助目标度量学习。此外,可以为目标域学习线性或非线性距离度量。针对场景分类和对象识别的广泛实验,也证明了我们所提出的这一方法的优越性。
论文地址:https://www.ijcai.org/proceedings/2017/0341.pdf
用于泛化规划的层次有限状态控制器
Hierarchical Finite State Controllers for Generalized Planning
论文摘要:有限状态控制器(Finite State Controllers,FSC)是一种紧凑地表征顺序规划的有效方式。通过在过渡上施加适当的条件,FSC 也能表征解决给定领域内的一系列的规划问题。这篇论文介绍了分层 FSC的概念,它通过允许控制器调用其它控制器来进行规划。其中证明分层 FSC 可以比个体 FSC更紧凑地表征一般规划。此外,其调用机制允许以模块化的方式生成分层 FSC,甚至应用递归方式。论文还介绍了能让经典规划者生成分层 FSC 的汇编,这能解决很有挑战性的一般规划问题。此汇编以来自特定领域的规划问题集合作为输入,然后输出一个单一经典规划问题,这种解决方案对应着一个分层 FSC。
论文地址:https://www.ijcai.org/Proceedings/16/Papers/458.pdf
用于非凸优化的递归分解
Recursive Decomposition for Nonconvex Optimization
论文摘要:连续优化是人工智能多个领域的一个重要的问题,包括计算机视觉、机器人、概率推理与机器学习。遗憾的是,大多数现实世界的优化问题都是非标准技术,所以即使是像随机重启和模拟退火这样的延伸,标准凸面技术也只能找到局部最优解。我们观察到,在许多情况下,目标函数的局部模式有组合结构,因此,组合优化的思路可以支撑。在此基础上,我们提出一个非凸优化问题的分解办法。类似于 DPLL 风格的 SAT 方法和概率推理中的递归调节,我们的算法将变量递归后,简化并分解目标函数成近似独立的子函数,直到剩余的功能很简单能够用标准技术进行优化,如梯度下降。根据图形的划分来选择变量,确保分解的可能性。我们的分析表明,RDIS 的建立的可以解决一大类非凸优化梯度下降的问题指数随机重新启动。实验结果表明,在运动和蛋白质折叠的结构的相关问题上,RDIS 优于标准技术。
论文地址:https://www.ijcai.org/Proceedings/15/Papers/042.pdf
用于后验估算的贝叶斯主动学习
Bayesian Active Learning for Posterior Estimation
论文摘要:该论文研究了在可能性评估代价高昂前提下,在贝叶斯设定中积极的后验估算。现有技术的后验估算依赖于后验代表性样本的形成。这种方法并不能支撑可能性评估方面考的效率。为了进行有效的查询,我们将后验估算放在有效的回归框架中进行。对于选择在哪里评估可能性,我们提出两个近视的查询策略,并对他们进行高斯过程。通过一系列的合成实验和真实的例子,证实我们的方法比现有的技术和其他启发式后验估算有着更显著的查询效率。
论文地址:https://www.ijcai.org/Proceedings/15/Papers/507.pdf
通过随机向量实现高维度贝叶斯优化
Bayesian Optimization in High Dimensions via Random Embeddings
论文摘要:贝叶斯优化技术已成功应用于机器人、决策规划、传感器安置、推荐、广告、智能化用户界面和自动算法成形。尽管取得这些成功,该方法仅限于中等规模的问题,而贝叶斯优化的几次研讨会已将其放到更高的维度作为一个领域的圣杯。在本文中,我们引入一个新的随机嵌入的思路,来应对这一问题。由此产生的随机嵌入贝叶斯优化算法(REMBO)很简单,并适用于绝对连续变量领域。实验证明该方法有效解决高维问题,包括流行的混合整数线性规划求解器的自动参数配置。
论文地址:https://www.ijcai.org/Proceedings/13/Papers/263.pdf
简单时态问题的灵活性及去耦
Flexibility and Decoupling in the Simple Temporal Problem
论文摘要:在本文中,我们重点寻找一个合适的度量,以确定简单时态问题(STP)的适应性。在评估一些已经提出的适应性指标之后,我们推断这些指标未能捕捉到在 STP 指定事件之间的相关性,导致了对现有系统适应性的高估。我们建议,在不相关的时间间隔基础上,对 STP 事件的允许启动时间使用一个直观且更易于接受的适应性指标。这个指标被证明可以计算在低多项式的时间。作为一个灵活计算的副产品,我们得到一个分解的 STN 几乎免费:对事件空间里每一个可能的 k-partitioning,都可以在 O(k)-time 进行分解计算。更重要的是,我们证明了与当前普遍观点相反的事实:这样的分解不影响原始 STP 的适应性。
论文地址:https://www.ijcai.org/Proceedings/13/Papers/356.pdf
博尔达计数下的无加权联合操纵是 NP 难题
Unweighted Coalitional Manipulation Under the Borda Rule is NP-Hard
论文摘要:Borda 投票规则是一个基于位置的积分规则,面向 M 个候选人,规定第一位选举候选人获得 M-1 分,第二位获得 M-2 分,以此类推。总分最高的候选人成为最终的胜出者。Borda 规则下的无加权联合操纵问题的计算复杂度,一直都是一个突出的开放性问题:是否可以添加一定的额外投票数(称为操纵器)选举一位杰出的候选人成为胜出者?我们通过显示 NP 难度来解决这个开放的问题,即使是有两个操纵器和三个输入票。此外,我们还讨论了这个难题结果的扩展和局限性。
论文地址:https://www.ijcai.org/Proceedings/11/Papers/021.pdf
2D 与 3D 欧几里得空间中连接约束的判别
On the Decidability of Connectedness Constraints in 2D and 3D Euclidean Spaces
论文摘要:我们研究了(无量词)空间约束语言,它具有相等、接触和连通性谓词,以及在低维欧几里德空间经过解释的区域上的布尔运算。 我们的实验表明,推理的复杂性根据空间的维度和所考虑的区域类型而发生巨大变化。 例如,具有内部连通性谓词(并且没有接触)的逻辑对于 R 的 2 次方中的多边形或常规闭合集、R 的 3 次方中的多面体上的 EXPTIME-complete 问题以及 R 的 3 次方中的常规闭合集上的 NP-complete 问题都是不可判定的。
论文地址:https://www.ijcai.org/Proceedings/11/Papers/165.pdf
对于蒙特卡洛树搜索的嵌套输出策略的调整
Nested Rollout Policy Adaptation for Monte Carlo Tree Search
论文摘要:蒙特卡洛树搜索(MCTS)方法最近在游戏、规划和优化等领域的取得成功。MCTS 是利用输出来指导搜索;其中一个展示的是随机决策树在每一层的下降路径,直到到达叶子。MCTS 的结果会受到适当的策略强烈影响并使输出结果出现偏差。以往的 MCTS 工作中,大多都使用静态随机或特定领域的策略。在决定性的优化问题上,我们描述了一种新的方法,即动态模拟搜索中的输出策略。我们的出发点是 Cazenave 的原始嵌套蒙特卡洛搜索(NMCS),相比直接操纵决策树本身,我们在嵌套搜索的每个层级上使用梯度上升的输出策略。我们以这一新的嵌套输出策略调整(NRPA)算法为基准并检测其表现。我们的测试问题是填字游戏和五子棋。在适当的时间规模下,相比 NMCS,NRPA 可以大大提高搜索效率,并在较长的时间的维度下,在测试问题中的改进也都超过了以往所有的解决方式。新的五子棋解决方案在保持了超过 30 年人类记录的基础上实现了提升。
论文地址:https://www.ijcai.org/Proceedings/11/Papers/115.pdf
Horn SHIQ 本体论的结果驱动推导
Consequence-Driven Reasoning for Horn SHIQ Ontologies
论文摘要:我们为 Horn SHIQ 本体论提出了一个新的推理程序——可将 SHIQ 本体论转换为一阶逻辑的 Horn 片段。与传统的本体推理程序相比,该推理程序不构建模型或模型表示,而是通过推导新的结论性公理来实现。它与 EL ++本体论所谓的基于完成的程序关联度很高,且可被视为后者其中的一项扩展。 实际上,我们提出的程序在理论上对于 Horn SHIQ 本体以及 EL ++ 和 SHIQ 的常见片段是最佳的。该程序在大型医学本体上进行的初步实证评估表明,与现有的本体推理机相比,我们的程序有了明显的改进。具体而言,该程序的实现能够对 Galen 可用性最高的 OWL 版本进行分类。 据我们所知,目前还没有其他推理机能够对这一本体进行分类。
论文地址:https://www.ijcai.org/Proceedings/09/Papers/336.pdf
使用查询实现学习条件偏爱网络
Learning Conditional Preference Networks with Queries
论文摘要:我们研究了在等价精确学习和成员查询的著名模型中诱发 CP-nets 的问题,目标是通过引导用户通过一系列的查询确定一个二进制值的偏好序列。每个示例都是对产出结果的优势度测试。在此设置中,我们表明了非循环的 CP-nets 仅根据等值查询是不具备学习性的,但如果给定的示例被限制交换,它们在成员查询的帮助下是可以学习的。任意示例中的树形 CP-nets 都具有相似的属性。事实上,针对查询复杂度仅为属性数的对数问题,成员查询允许我们提供属性有效的算法。这个结果强调了该模型在更多属性的领域中启用 CP-nets 的有效性。
论文地址:https://www.ijcai.org/Proceedings/09/Papers/319.pdf
大规模多级随机整数程序的在线预测算法性能分析
Performance Analysis of Online Anticipatory Algorithms for Large Multistage Stochastic Integer Programs
论文摘要:尽管近年来在算法方面取得了重大进展,然而现存方法距离为大规模、多级随机组合优化问题找到最佳策略还存在很远一段距离。该论文研究了一种互补的方法——在线预测算法,该算法通过解决多个场景的预测松弛问题在每个步骤做出决策。在线预测算法在多个应用中都实现了令人惊喜的好结果,同时这篇论文旨在阐述得出这一结果的过程。特别地,该论文在在线预测算法实现了良好的预期效用并研究了在算法中出现的各类误差(包括预测误差和抽样误差等)的情况下得到了充分条件。实验显示,针对对数个场景,抽样误差可以忽略不计,而预测误差对于现有的应用来说,无论在理论上还是实验中,都更难以绑定且非常小。
论文地址:https://www.aaai.org/Papers/IJCAI/2007/IJCAI07-319.pdf
使用贝叶斯网络实现从超声图像进行自动化心脏壁异常活动探测
Automated Heart Wall Motion Abnormality Detection From Ultrasound Images using Bayesian Networks
论文摘要:冠心病可以通过评估左心室超声图像中心脏壁的局部运动来诊断。我们描述了一个强大的全自动化技术,通过检测和自动跟踪左心室的心内膜和外膜来检测患病心脏病。基于局部很整个左心室壁的运动,心脏壁区域和整个心脏会被划分为正常区域和非正常区域。为了利用心脏的结构信息,我们对这个问题应用贝叶斯网络,并通过使用结构学习算法的数据,了解心脏壁面区域之间的关系。我们通过心脏解剖学知识和医生描述的医学规则检查了获得的结构的有效性。贝叶斯网络分类器仅依赖于一个小的子集,该子集的数值特征通过时间追踪和滤波器的选择方法提取对偶轮廓。我们的数值结果证实了我们的系统在医院日常实践中收集的超声心动图中是可靠和准确的,我们的系统就是为现实的使用而建立。
论文地址:https://www.ijcai.org/Proceedings/07/Papers/082.pdf
在 SAT 本地搜索中构建结构
Building Structure into Local Search for SAT
论文摘要:在本文中,我们表明本地搜索技术能有效地发掘问题结构信息,并且在结构化问题的例子的表现中产生显著的改善。在 Ostrowski 等人的早期工作的基础上,我们描述了如何将变量相关性信息内置到本地搜索中,以便只有独立变量被考虑反转。通过使用模型依赖于使用关口的变量的依赖框架,其每次反转的成本效应就可以被动态计算。困难结构基准问题的实验研证实了我们的新方法显著优于此前报道的最佳本地搜索技术。
论文地址:https://www.ijcai.org/Proceedings/07/Papers/380.pdf
学习协调分类器
Learning Coordination Classifiers
论文摘要:我们提出了一种只需学习单个基本分类器的新的集成分类方法,它的思路是学习一个能同时预测测试标签对的分类器,而不是学习单个测试标签的多个预测器,然后通过在数据上传播图上的信念来协调各个标签的分配。我们认为即便对于独立的同分布(iid)数据,该方法在统计上也能发挥很好的激励作用。 实际上,实验结果显示,这一方法在一系列 iid 数据集和一组基本分类器上的分类准确度,都要优于单一样本分类器。与增强类似,该技术通过分类器组合的基本形式来控制方差,从而增加表征能力。
论文地址:https://www.ijcai.org/Proceedings/05/Papers/1585.pdf
解决跳棋问题
Solving Checkers
论文摘要:AI 在游戏程序方面取得了巨大的成功,能够与人类最好的玩家媲美。而具有大型存储器和磁盘的快速、充裕的机器的可用性则为解决一款游戏问题创造了可能性。在这之前,一些相对简单或小型的游戏已经实现了。在这篇论文中,我们提出了解决跳棋游戏的新思路和新算法。跳棋游戏是一款广受欢迎的竞技游戏,存在 10 的 20 次方个可能位置的搜索空间。本论文展示了我们的第一个实验结果,解决了其中一个最具挑战性的跳棋开局问题——白旗先行导致平局。解决大概 50 多场开局问题将会让跳棋的游戏理论价值得到肯定。
论文地址:https://www.ijcai.org/Proceedings/05/Papers/0515.pdf
信息抽取冗余的概率模型
A Probabilistic Model of Redundancy in Information Extraction
论文摘要:无监督信息抽取(UIE)是一项从文本中提取知识的任务,该任务无需使用手动标注训练样本。无监督信息抽取和信息抽取二者的一个基本问题就是评估抽取信息的正确率。在网页等大型资料库中,不同的档案中往往存在重复地提取相同的知识的情况。那信息抽取的这种冗余会怎样影响正确率呢?
这篇论文介绍了一个组合的「ball-and-urns」模型,该模型能够计算出样本大小、冗余以及来自多个不同抽取规则的确证对于抽取信息的正确率的影响。我们描述了在实践中估计模型参数的方法,并通过实验证明,对于 UIE 来说,该模型的对数似然性平均比使用逐点互信息(PMI)以及此前在工作中使用的 noisy-or 模型的对数似然性要高出 15 倍。对于监督信息抽取而言,该模型的性能可与支持向量机以及逻辑回归媲美。
论文地址:https://www.ijcai.org/Proceedings/05/Papers/1390.pdf
德州扑克的游戏理论最优策略近似
Approximating Game-Theoretic Optimal Strategies for Full-scale Poker
论文摘要:德州扑克的游戏理论最优策略的首个完全近似的计算问题得到解决。该论文将几种抽象技术进行组合以表示大小为 O(10 的 18 次方)的两位玩家的德州扑克游戏,同时使用每个大小都为 O(10 的 7 次方)的密切相关的模型。 尽管大小系数减少了 1000 亿,但最终模型仍保留了真实游戏的关键属性和结构。 将抽象游戏的线性编程解决方案用来创建大幅改进的扑克游戏程序,不仅能够击败强大的人类玩家,还能与世界级的选手对战。
论文地址: https://www.ijcai.org/Proceedings/03/Papers/097.pdf
即时定位与地图构建的稀疏连接树滤波器
Thin Junction Tree Filters for Simultaneous Localization and Mapping
论文摘要:即时定位与地图构建(SLAM)是移动机器人的一个基本问题:当机器人在未知环境中进行导航时,它必须逐步构建周围环境的地图,并同时在该地图内对自身进行定位。一种常用的解决方案是将 SLAM 视为估计问题,并应用卡尔曼滤波器,这种方法很讲究,但无法很好地扩展:信念状态的大小和滤波器更新的时间复杂度都会在地图中的地标数量上呈二次方增长。本文提出了一种过滤技术,它将信念状态的易处理近似维持为一个稀疏连接树。连接树随着过滤器的更新增长,并通过有效的最大似然投影周期性地「变稀疏」,因而其推断仍然易于处理。当应用于 SLAM 问题时,这些稀疏连接树滤波器具有线性空间信念状态和线性时间滤波操作。进一步的近似所生成的滤波操作通常是恒定时间的。本论文对一系列 SLAM 问题进行的实验,也对这种方法进行了验证。
论文地址:https://www.ijcai.org/Proceedings/03/Papers/166.pdf
基于架构的因果关系的复杂结果
Complexity Results for Structure-Based Causality
论文摘要:我们给出了 Pearl 结构模型中因果关系的计算复杂性的精确图像,在该模型中,我们关注变量之间的因果关系、事件因果关系以及概率因果关系。至于变量之间的因果关系,我们考虑因果不相关的概念、原因、上下语境中的原因、直接原因和间接原因。针对事件因果关系,我们分析了必要和可能原因的概念的复杂度,以及 Halpern 和 Pearl 所提出的弱和实际原因的复杂概念。在此过程中,我们也证明了 Halpern 和 Pearl 所提出的一个开放式猜想,并展示了其他的语义结果。然后,我们分析了与概率因果无关的概率概念的复杂性、事件的可能原因以及事件的发生,而忽略其他事件。除此之外,我们还考虑涉及反事实公式的决策和优化问题。据我们所知,该领域迄今为止尚未考虑结构模型方法中因果关系的复杂度方面,而我们的实验结果中则体现了这一问题。雷锋网
论文地址:https://www.sciencedirect.com/science/article/pii/S0004370202002710
雷峰网原创文章,未经授权禁止转载。详情见转载须知。