天天看点

软件事务内存导论(九) 集合与事务

在我们努力学习这些示例的过程中,很容易就会忘记我们所要处理的值都必须是不可变的。只有实体才是可变的,而状态值则是不可变的。虽然stm已经为我们减轻了很多负担,但如果想要在维护不可变性的同时还要兼顾性能的话,对我们来说也将是一个非常严峻的挑战。

为了保证不可变性,我们采取的第一个步骤是将单纯用来保存数据的类(value classes)及其内部所有成员字段都置为final(在scala中是val)。然后,我们需要传递地保证我们自己定义的类里面的字段所使用的类也都是不可变的。可以说,将字段和类的定义置为final这一步是整个过程的基础,这同时也是避免并发问题的第一步。

虽说不可变性可以使代码变得又好又安全,但是由于性能问题,程序员们还是不大愿意使用这一特性。其症结在于,为了维护不可变性,我们可能在数据没发生任何变动的情况下也要进行拷贝操作,而这种无谓的拷贝对性能伤害很大。为了解决这个问题,我们在3.6节中曾经讨论过持久化数据结构以及如何使用这类数据结构来减轻程序在性能方面的负担。而在持久化数据结构的实现方面,已经有很多现成的第三方库可供使用,而scala本身也提供了这类数据结构。由于java也有实现好的持久化数据结构可用,所以我们就无需专门为使用这个特性而去换用自己不熟悉的语言。

除了不可变性之外,我们还希望能获得一些事务运行所需要的数据结构——这些数据结构的值是不可变的,但其实体可以在托管事务中被改变。akka提供了两种托管数据结构——transactionalvector和transactionalmap。这两种数据结构源自于高效的scala数据结构,其工作原理和java的list、map类似。下面就让我们一起来学习如何在java和scala中使用transactionalmap

<b>在java中使用事务集合类</b>

在java中使用transactionalmap是非常简单的。例如,下面我们一起来写一个为运动员们记录得分的程序,其中对于得分的更新操作是并发执行的。这里我们将不采用同步或锁的方式,而是把所有更新操作都放在事务中处理。示例代码如下所示:

<code>01</code>

<code>public</code>  <code>class</code>  <code>scores  {</code>

<code>02</code>

<code>    </code><code>final</code>  <code>private</code>  <code>transactionalmap&lt;string,  integer&gt;  scorevalues  =</code>

<code>03</code>

<code>        </code><code>new</code>  <code>transactionalmap&lt;string,  integer&gt;();</code>

<code>04</code>

<code>    </code><code>final</code>  <code>private</code>  <code>ref&lt;long&gt;  updates  = </code><code>new</code>  <code>ref&lt;long&gt;(0l);</code>

<code>05</code>

<code>    </code><code>public</code>  <code>void</code>  <code>updatescore(</code><code>final</code>  <code>string  name, </code><code>final</code>  <code>int</code>  <code>score)  {</code>

<code>06</code>

<code>        </code><code>new</code>  <code>atomic()  {</code>

<code>07</code>

<code>            </code><code>public</code>  <code>object  atomically()  {</code>

<code>08</code>

<code>                </code><code>scorevalues.put(name,  score);</code>

<code>09</code>

<code>                </code><code>updates.swap(updates.get()  + </code><code>1</code><code>);</code>

<code>10</code>

<code>                </code><code>if</code>  <code>(score  == </code><code>13</code><code>)</code>

<code>11</code>

<code>                    </code><code>throw</code>  <code>new</code>  <code>runtimeexception(</code><code>"reject  this  score"</code><code>);</code>

<code>12</code>

<code>                    </code><code>return</code>  <code>null</code><code>;</code>

<code>13</code>

<code>            </code><code>}</code>

<code>14</code>

<code>        </code><code>}.execute();</code>

<code>15</code>

<code>    </code><code>}</code>

<code>16</code>

<code>    </code><code>public</code>  <code>iterable&lt;string&gt;  getnames()  {</code>

<code>17</code>

<code>        </code><code>return</code>  <code>asjavaiterable(scorevalues.keyset());</code>

<code>18</code>

<code>19</code>

<code>    </code><code>public</code>  <code>long</code>  <code>getnumberofupdates()  { </code><code>return</code>  <code>updates.get();  }</code>

<code>20</code>

<code>    </code><code>public</code>  <code>int</code>  <code>getscore(</code><code>final</code>  <code>string  name)  {</code>

<code>21</code>

<code>        </code><code>return</code>  <code>scorevalues.get(name).get();</code>

<code>22</code>

<code>23</code>

<code>}</code>

在updatescore()函数中,我们把设置某个运动员的得分以及增加更新次数的操作都收敛到一个事务里面,该事务中所用到的transactionalmap类型的scorevalue字段以及ref类型updates字段都是托管类型。其中transactionalmap支持普通map的所有函数,只不过这些函数都是事务性的——即一旦事务回滚,我们对其进行的任何变更都将被丢弃。为了能够观察到实际的效果,我们人为地设置了一个回滚条件,即当得分为13的时,我们会先完成变更操作,然后抛异常令事务回滚。

在java中,如果集合类实现了iterable接口的话,我们就可以使用像for(string name: collectionofnames)这样的for-each语句。但transactionalmap是一个scala集合类,并且没有直接支持这个接口。别担心——scala提供了一个叫做javaconversions的门面(façade设计模式——译者注),该门面提供了很多方便的函数来获取我们想要的java接口。例如,我们可以使用asjavaiterable()函数来获取原本需要使用getnames()函数才能拿到的接口。

至此我们已经完成了scores类的全部功能,接下来我们还需要写一个测试用例来检验scores类所实现的这些功能:

<code>package</code>  <code>com.agiledeveloper.pcj;</code>

<code>public</code>  <code>class</code>  <code>usescores  {</code>

<code>    </code><code>public</code>  <code>static</code>  <code>void</code>  <code>main(</code><code>final</code>  <code>string[]  args)  {</code>

<code>        </code><code>final</code>  <code>scores  scores  = </code><code>new</code>  <code>scores();</code>

<code>        </code><code>scores.updatescore(</code><code>"joe"</code><code>, </code><code>14</code><code>);</code>

<code>        </code><code>scores.updatescore(</code><code>"sally"</code><code>, </code><code>15</code><code>);</code>

<code>        </code><code>scores.updatescore(</code><code>"bernie"</code><code>, </code><code>12</code><code>);</code>

<code>        </code><code>system.out.println(</code><code>"number  of  updates:  "</code>  <code>+  scores.getnumberofupdates());</code>

<code>        </code><code>try</code>  <code>{</code>

<code>            </code><code>scores.updatescore(</code><code>"bill"</code><code>, </code><code>13</code><code>);</code>

<code>        </code><code>} </code><code>catch</code><code>(exception  ex)  {</code>

<code>            </code><code>system.out.println(</code><code>"update  failed  for  score  13"</code><code>);</code>

<code>        </code><code>}</code>

<code>        </code><code>for</code><code>(string  name  :  scores.getnames())  {</code>

<code>            </code><code>system.out.println(</code>

<code>            </code><code>string.format(</code><code>"score  for  %s  is  %d"</code><code>,  name,  scores.getscore(name)));</code>

上例中,我们先是添加了三个正常的运动员成绩,随后又增加了一个可以导致事务回滚的成绩。但由于事务的存在,所以最后一个成绩更新操作最终是无效的。而在代码的最后,我们会遍历并输出事务性map里面的所有数据。下面让我们观察一下这段代码的输出结果:

<b>在scala中使用事务集合类</b>

在scala中,我们可以用与java类似的方式来使用事务集合类。只不过由于这次是在scala中,所以这里我们需要使用scala的内部迭代器而不是javaconversions门面(facade)。下面让我们把scores类翻译成scala代码:

<code>class</code>  <code>scores  {</code>

<code>    </code><code>private</code>  <code>val</code>  <code>scorevalues </code><code>=</code>  <code>new</code>  <code>transactionalmap[string,  int]()</code>

<code>    </code><code>private</code>  <code>val</code>  <code>updates </code><code>=</code>  <code>ref(</code><code>0</code><code>l)</code>

<code>    </code><code>def</code>  <code>updatescore(name </code><code>:</code>  <code>string,  score </code><code>:</code>  <code>int) </code><code>=</code>  <code>{</code>

<code>        </code><code>atomic  {</code>

<code>            </code><code>scorevalues.put(name,  score)</code>

<code>            </code><code>updates.swap(updates.get()  + </code><code>1</code><code>)</code>

<code>            </code><code>if</code>  <code>(score </code><code>==</code>  <code>13</code><code>) </code><code>throw</code>  <code>new</code>  <code>runtimeexception(</code><code>"reject  this  score"</code><code>)</code>

<code>    </code><code>def</code>  <code>foreach(codeblock </code><code>:</code>  <code>((string,  int)) </code><code>=</code><code>&gt;  unit) </code><code>=</code>

<code>        </code><code>scorevalues.foreach(codeblock)</code>

<code>    </code><code>def</code>  <code>getnumberofupdates() </code><code>=</code>  <code>updates.get()</code>

如上所示,updatescore()函数与java版本基本是相同的。唯一有点区别的地方是,我们去掉了getnames()函数和getscore()函数,并为foreach()提供了内部迭代器来遍历map中的数据。我们在下面所列出了scala版usescores类的实现,这段代码是其java版代码的直译:

<code>package</code>  <code>com.agiledeveloper.pcj</code>

<code>object</code>  <code>usescores  {</code>

<code>    </code><code>def</code>  <code>main(args </code><code>:</code>  <code>array[string]) </code><code>:</code>  <code>unit </code><code>=</code>  <code>{</code>

<code>        </code><code>val</code>  <code>scores </code><code>=</code>  <code>new</code>  <code>scores()</code>

<code>        </code><code>scores.updatescore(</code><code>"joe"</code><code>, </code><code>14</code><code>)</code>

<code>        </code><code>scores.updatescore(</code><code>"sally"</code><code>, </code><code>15</code><code>)</code>

<code>        </code><code>scores.updatescore(</code><code>"bernie"</code><code>, </code><code>12</code><code>)</code>

<code>        </code><code>println(</code><code>"number  of  updates:  "</code>  <code>+  scores.getnumberofupdates())</code>

<code>            </code><code>scores.updatescore(</code><code>"bill"</code><code>, </code><code>13</code><code>)</code>

<code>        </code><code>} </code><code>catch</code>  <code>{</code>

<code>            </code><code>case</code>  <code>ex </code><code>=</code><code>&gt;  println(</code><code>"update  failed  for  score  13"</code><code>)</code>

<code>        </code><code>scores.foreach  {  mapentry </code><code>=</code><code>&gt;</code>

<code>            </code><code>val</code>  <code>(name,  score) </code><code>=</code>  <code>mapentry</code>

<code>            </code><code>println(</code><code>"score  for  "</code>  <code>+  name  + </code><code>"  is  "</code>  <code>+  score)</code>

不出所料,测试用例的输出结果也与java版代码如出一辙: