缩水号怎么投注(3)

2019-05-01 10:34栏目：新闻

图 3：NLM 中的计算模块，以第 i 层的二元谓项为例。其中 C 的上下标分别表示组与层级，C 表示不同组与层级下的输出谓项数。[·] 表示张量形状。

实验

研究者在大量任务上对 NLM 进行了实验，包括关系推理、决策等。此外，研究者还证明使用小规模实例训练的 NLM 可以泛化到大规模实例上。在实验中，Softmax-Cross-Entropy 损失用于监督学习任务，REINFORCE (Williams, 1992) 用于强化学习任务。

研究者使用 Memory Networks (MemNN) (Sukhbaatar et al., 2015) 和 Differentiable Inductive Logic Programming (∂ILP) (Evans & Grefenstette, 2018) 分别作为联结主义和符号主义的基线模型。

家族树推理和图推理

家族树是归纳逻辑程序设计的基准，在该任务中，向机器提供包含 m 个成员的家族树。该家族树由以下关系（谓项）表示：IsSon、IsDaughter、IsFather 和 IsMother。该任务的目标是推断出家族成员的其他属性或他们之间的关系。研究者还进一步将家族树扩展至通用图。

实验结果见表 1。

表 1：在家族树和图推理任务中，MemNN、∂ILP 和 NLM 的对比，其中 m 表示家族树或图的规模。∂ILP 和 NLM 的性能均优于神经基线模型，在测试集上达到了 100% 的准确率。注意：N/A 标记表示 ∂ILP 无法在 2-OutDegree 中扩展。

积木世界、排序和寻找最短路径

研究者在经典的积木世界问题（见图 1）上测试了 NLM 的决策性能，他们将 NLM 模型扩展至强化学习的马尔科夫决策过程（MDP）中。此外，研究者还在算法任务上测试了 NLM 的能力，如排序算法和路径算法。

NLM 在积木世界、排序和寻找最短路径任务上的性能如下所示：

表 2：在积木世界、整数排序和寻找最短路径任务中，MemNN 和 NLM 的性能对比。

其中 m 表示积木世界环境中的积木数、排序环境中的数组规模，或者寻找最短路径环境中的图数量。两个模型都在 m ≤ 12 的情况下训练，在 m = 10 或 50 的情况下测试。性能评估指标有两个，由／分隔，二者分别是：测试中完成任务的概率、完成任务时智能体使用的平均步数。MemNN 无法在最大 m × 4 步数下完成积木世界任务。

本文为机器之心编译，转载请联系本公众号获得授权。

责任编辑：

缩水号怎么投注(3)

随机看看

热门文章