天天看点

逻辑式编程语言极简实现(使用C#) - 3. 运行原理

图文讲解,一门教学级逻辑式编程语言,NMiniKanren,的运行原理。

本系列前面的文章:

逻辑式编程语言极简实现(使用C#) - 1. 逻辑式编程语言介绍

逻辑式编程语言极简实现(使用C#) - 2. 一道逻辑题:谁是凶手

第二天,好为人师的老明继续开讲他的私人课堂。

“今天讲NMiniKanren的运行原理。”老明敲了敲白板,开始涂画代码,“我们从一个喜闻乐见的例子开始。”

“这题我会了!”小皮在例子下边写下答案:

看到小皮没把昨天的知识忘光,老明略感欣慰:“不错。你这个答案是怎么算出来的呢?”

“呃……就是那个……”小皮忽然卡壳了。这种问题就好比几何证明题,明明一眼就能看出来的两条垂直线,真下手证明却发现还挺不容易。小皮抓了几把头发,总算理出一缕思绪:“大概就是找出所有条件可能的组合……然后算一下解……”小皮一边说,一边在白板上写着:

<code>x == 1</code>

<code>y == x =&gt; (x y) == (1 1)</code>

<code>y == "b" =&gt; (x y) == (1 "b")</code>

<code>x == 2</code>

<code>y == x =&gt; (x y) == (2 2)</code>

<code>y == "b" =&gt; (x y) == (2 "b")</code>

“嗯,其实你已经知道怎么算出答案来了。只是对于其中的细节还不甚明了。我们接下来要做的事要理清楚这个计算过程,得到一个每一步都可以由计算机明确执行的算法。

“这个算法其实就是你所说这样,找出所有可能的条件组合。每组条件组合可以求出一个解,也可能自相矛盾从而无解。由于NMiniKanren中的条件都是相等条件,所以一组条件组合可以看作一个替换(Substitution)。一个替换能产生一个解,或者无解。

“因此,只需解决下面两个问题:

要在什么数据结构上按照什么顺序遍历替换。

如何从替换中算出一个解,或者判断其无解。”

首先,我们要从代码构造出一个数据结构(其实就是一张图)。这个数据结构能够按照一定的顺序进行遍历,并依次生成替换。

例子中的代码使用到了<code>Eq</code>、<code>Any</code>和<code>All</code>这三种构造目标的方法。下面分别探讨怎样从这三种方法构造出我们需要的数据结构来。

“<code>k.Eq(a, b)</code>构造的目标是什么意思呢?”老明以一个看似平凡的问题开头。

“简单,意思就是<code>a</code>要等于<code>b</code>这个条件。”

“孤立地看,是这样。但是考虑到上下文,更精确地说应该是,在上下文的基础上追加<code>a</code>等于<code>b</code>这个条件。”

小皮有点不解:“emm……多了‘追加’有什么不同呢?”

“从文字上看,多了‘追加’后,目标的解释从一种名词(一组条件)变成了动词(追加条件)。这样一来,目标不仅表达了一组条件,同时也表达了这些条件如何跟上下文结合。就<code>Eq</code>的情况来说,这个结合方式是‘追加’。而<code>Any</code>和<code>All</code>会有其他结合方式。”

“虽然还不是很明白,我想这个要等<code>Any</code>和<code>All</code>的情况一起对比才能清晰起来。我还另外有个问题,上下文指的是什么?”

“狭义地说,上下文是解释器运行到这一条代码时,已执行的代码生成的替换。

“广义上看,上下文还应该包含回溯分支等控制信息,不过目前我们先忽略这些。

“综合起来,按照对<code>Eq</code>目标的解释,我们可以用下图来表示这个目标。”

逻辑式编程语言极简实现(使用C#) - 3. 运行原理

“接着看<code>Any</code>。按照上面的讨论,我们要怎么解释<code>Any</code>目标呢?”老明继续发问。

“解释目标要说清楚两个方面:名词(什么条件)和动词(如何与上下文结合)。以一开始的例子中的<code>k.Any(k.Eq(x, 1), k.Eq(x, 2))</code>为例。名词方面自然就是<code>x</code>等于1和<code>x</code>等于2两个条件了,不过这两个条件是‘或’的关系。动词方面,应该是从上下文分岔出两个分支,一个分支追加<code>x</code>等于1这个条件,另一个分支追加<code>x</code>等于2这个条件。”

“很好。也就是说,和<code>Eq</code>不同,<code>Any</code>操作和上下文结合后,会生成多个替换。”老明赞许地点点头,“它把参数的分支都放在一起,就像加法似的。用图表示的话,就像下面这样。”

逻辑式编程语言极简实现(使用C#) - 3. 运行原理

“最后是<code>All</code>……”

“这个我也会了!”小皮打断老明,“<code>k.All(a, b)</code>名词上表示条件<code>a</code>且条件<code>b</code>;动词上表示上下文先追加<code>a</code>,再追加<code>b</code>。”

“你说的太笼统了。<code>a</code>和<code>b</code>可能都有多个分支,这种情况下怎么做?”老明接着问道。

小皮想了想一开始做的例子,答道:“这种情况要取所有组合,也就是<code>a</code>的分支和<code>b</code>的分支两两组合!最后分支数量等于<code>a</code>分支数量乘以<code>b</code>分支数量。”

“很好。如果<code>Any</code>类比加法,那么<code>All</code>类比的是乘法。下面这图描述了开头例子中的<code>All</code>方法的结合过程。

逻辑式编程语言极简实现(使用C#) - 3. 运行原理

“这是个有向图,每条边表示一次追加条件的过程。每条从开始节点(上下文)到结尾的路径,上面的节点组合起来就是一个替换。遍历所有路径,我们就遍历了所有替换。而遍历的顺序,就是解释器输出结果的顺序。”

逻辑式编程语言极简实现(使用C#) - 3. 运行原理
逻辑式编程语言极简实现(使用C#) - 3. 运行原理

接下来我们还可以来看看<code>Anyi</code>。

普通的<code>Any</code>使用的普通的树结构遍历顺序:

逻辑式编程语言极简实现(使用C#) - 3. 运行原理

而<code>Anyi</code>以交替的顺序遍历分支:

逻辑式编程语言极简实现(使用C#) - 3. 运行原理

<code>Alli</code>类似采用交替的顺序遍历,这里就不再画了(主要是不好画,懒)。

上一篇主要从构造目标的角度出发,介绍了不同方式构造出来的目标。为了实现NMiniKanren的解释器,我们需要更加深入地了解在解释器的实现中,Goal是什么类型。

在前面的讨论中,我们知道,目标的含义是对上下文/一个替换按照某种方式追加一些条件,返回零个、一个或多个替换——<code>Eq</code>返回一个;<code>Any</code>和<code>All</code>可能返回多个;另外前面没讨论到的<code>Fail</code>会返回零个。

从这个描述不难看出,最方便表述目标类型的是一个单参数函数,其参数是一个替换,返回值是替换的枚举,相当于C#中的<code>Enumerable&lt;替换&gt;</code>,也可以说是一个替换的流(Stream)。

<code>Goal(替换)</code>这个函数调用的含义是把Goal包含的条件,追加到替换上,返回一系列(因为可能有分支,就会变成多个)的替换。

“为什么不直接用<code>List</code>呢?”小皮又发问了。

“因为很多情况下,分支数量会很多,甚至是无穷多,而我们只需要挨个取前面几个结果就够了。这种情况下使用<code>List</code>会极大降低解释器效率,甚至造成死循环。”

“略。”

“啥?”小皮瞪了下眼。

“懒得画,留着思考吧。”

“生成替换后,剩下的就是求解了。

“替换求解的方法很简单,就是应用一下小学时学过的代入消元法。来,看看这个怎么解。”老明一边说一边写下例题:

毕竟是小学难度的题目,小皮看了一眼,马上就有了解法:“<code>x</code>等于1是确定的了,把(3)代入(1)后,<code>y</code>也等于1。把(1)和(3)都代入(2),得到<code>q</code>等于<code>(1 1)</code>。”

“解是求出来了,不过你觉得你这个步骤有通用性吗?”老明虚着眼说,“计算机能自觉地使用你这个蛇皮顺序吗?”

“呃……”小皮陷入沉思。判断代入顺序的规则似乎还挺麻烦的。或者简单粗暴按照所有顺序都代入一遍?

“其实没想象中复杂,按顺序代入一遍,再反过来代入一遍,就OK了。”

把(1)代入(2)(3):

把(2)代入(3):

在解释器实现中,条件是一条一条追加上来的。可以每次追加条件的时候,将已有的条件代入新条件,这样就把这一步化解到生成替换的过程中了。

加入条件(1) <code>y == x</code>:

加入条件(2) <code>q == (x y)</code>:

加入条件(3) <code>x == 1</code>:

把(3)代入(2)(1):

把(2)代入(1):

搞定!

这只是个简单的例子。实际情况还可能会出现无解、自由变量以及死循环等情况。这里就不多赘述了。

“现在能看出NMiniKanren为什么不支持‘非’运算了吗?”

小皮认真想了一会,说:“岂止不支持‘非’,‘大于’和‘小于’这些也不行吧。按照代入消元法,NMiniKanren只支持相等条件。”。

“那如果要支持这些运算应该怎么做呢?”

“要拓展条件的类型。除了相等条件,还要有不相等条件等。响应的求解算法也要有所变化。”

“没错。改动虽然不大,但是代码看起来会混乱得多。所以以教学为目的的话,就不支持这些了。”

不知不觉时间已到了喜闻乐见的午餐时间,于是老明总结道:“虽然还没有落地成代码,但运行原理算是弄清楚了。关键点就两个:

如何从替换中算出一个解,或者判断其无解。

“第一点,我们从代码构造了一张图。该图的每条路径对应一个替换,遍历路径的顺序就是遍历替换的顺序。同时也明确了目标Goal的类型。

“第二点,我们使用代入消元法,来回两遍代入解出了所有未知量。”

“接下来可以写代码实现NMiniKanren解释器了吧。”理解了原理后,小皮的十条手指已经饥渴难耐,蚯蚓似的扭动着。

“不着急,下午还要先讲一个编程小技巧,然后就可以开搞了。”

继续阅读