天天看点

SWAP_JOIN_INPUTS Oracle Hint(处理hash join强制大表(segment_size大)作为被驱动表)

swap_join_inputs是针对哈希连接的hint,它的含义是让优化器交换原哈希连接的驱动表和被驱动表的顺序,即在依然走哈希连接的情况下让原哈希连接的驱动表变被驱动表,让原哈希连接的被驱动表变为驱动表。

注意,在swap_join_inputs hint中指定的目标表应该是原哈希连接中的被驱动表,否则oracle会忽略该hint。

/*+ swap_join_inputs(原哈希连接的被驱动表) */

其使用范例如下:

<code>select</code> <code>/*+ leading(dept) use_hash(emp) swap_join_intputs(emp) */ * </code><code>from</code> <code>emp,dept </code><code>where</code>

<code>emp.deptno=dept.deptno</code>

测试案例:

<code>SCOTT@ORA12C&gt; </code><code>create</code> <code>table</code> <code>t1 </code><code>as</code> <code>select</code> <code>* </code><code>from</code> <code>dba_objects </code><code>where</code> <code>rownum&lt;2;</code>

<code>Table</code> <code>created.</code>

<code>SCOTT@ORA12C&gt; </code><code>create</code> <code>table</code> <code>t2 </code><code>as</code> <code>select</code> <code>* </code><code>from</code> <code>dba_objects </code><code>where</code> <code>rownum&lt;12;</code>

<code>SCOTT@ORA12C&gt; </code><code>create</code> <code>table</code> <code>t3 </code><code>as</code> <code>select</code> <code>* </code><code>from</code> <code>dba_objects </code><code>where</code> <code>rownum&lt;22;</code>

收集统计信息:

<code>SCOTT@ORA12C&gt; </code><code>exec</code> <code>dbms_stats.gather_table_stats(ownname =&gt; </code><code>'SCOTT'</code><code>,tabname =&gt; </code><code>'T1'</code><code>,estimate_percent =&gt; 100,</code><code>cascade</code> <code>=&gt; </code><code>true</code><code>,method_opt =&gt; </code><code>'for all columns size 1'</code><code>,no_invalidate =&gt; </code><code>false</code><code>);</code>

<code>PL/SQL </code><code>procedure</code> <code>successfully completed.</code>

<code>SCOTT@ORA12C&gt; </code><code>exec</code> <code>dbms_stats.gather_table_stats(ownname =&gt; </code><code>'SCOTT'</code><code>,tabname =&gt; </code><code>'T2'</code><code>,estimate_percent =&gt; 100,</code><code>cascade</code> <code>=&gt; </code><code>true</code><code>,method_opt =&gt; </code><code>'for all columns size 1'</code><code>,no_invalidate =&gt; </code><code>false</code><code>);</code>

<code>SCOTT@ORA12C&gt; </code><code>exec</code> <code>dbms_stats.gather_table_stats(ownname =&gt; </code><code>'SCOTT'</code><code>,tabname =&gt; </code><code>'T3'</code><code>,estimate_percent =&gt; 100,</code><code>cascade</code> <code>=&gt; </code><code>true</code><code>,method_opt =&gt; </code><code>'for all columns size 1'</code><code>,no_invalidate =&gt; </code><code>false</code><code>);</code>

3个表的记录如下:

<code>SCOTT@ORA12C&gt; </code><code>select</code> <code>count</code><code>(*) </code><code>from</code> <code>t1;</code>

<code> </code><code>COUNT</code><code>(*)</code>

<code>-----------------</code>

<code>1</code>

<code>1 row selected.</code>

<code>SCOTT@ORA12C&gt; </code><code>select</code> <code>count</code><code>(*) </code><code>from</code> <code>t2;</code>

<code>       </code><code>11</code>

<code>SCOTT@ORA12C&gt; </code><code>select</code> <code>count</code><code>(*) </code><code>from</code> <code>t3;</code>

<code>       </code><code>21</code>

现在我们来让表T2和T3做哈希连接,由于T3表的记录数比T2表的记录数多,所以这里指定T3为哈希连接的被驱动表:

<code>select</code> <code>/*+ ordered use_hash(t3) */ t2.object_name,t3.object_type</code>

<code>  </code><code>2  </code><code>from</code> <code>t2,t3 </code><code>where</code> <code>t2.object_id=t3.object_id;</code>

<code>Execution Plan</code>

<code>----------------------------------------------------------</code>

<code>Plan hash value: 1730954469</code>

<code>---------------------------------------------------------------------------</code>

<code>| Id  | Operation   | </code><code>Name</code> <code>| </code><code>Rows</code>  <code>| Bytes | Cost (%CPU)| </code><code>Time</code>  <code>|</code>

<code>|   0 | </code><code>SELECT</code> <code>STATEMENT   |  |    11 |   220 |6   (0)| 00:00:01 |</code>

<code>|*  1 |  HASH </code><code>JOIN</code>   <code>|  |    11 |   220 |6   (0)| 00:00:01 |</code>

<code>|   2 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T2   |    11 |   110 |3   (0)| 00:00:01 |</code>

<code>|   3 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T3   |    21 |   210 |3   (0)| 00:00:01 |</code>

<code>Predicate Information (identified </code><code>by</code> <code>operation id):</code>

<code>---------------------------------------------------</code>

<code>   </code><code>1 - access(</code><code>"T2"</code><code>.</code><code>"OBJECT_ID"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_ID"</code><code>)</code>

可以看到,上述SQL的执行计划现在走的是哈希连接,并且被驱动表示表T3.

如果我们想让哈希连接的被驱动表由T3变成T2,可以在上述sql加入swap_join_inputs hint:

<code>select</code> <code>/*+ ordered use_hash(t3) swap_join_inputs(t3) */ t2.object_name,t3.object_type</code>

<code>Plan hash value: 1723280936</code>

<code>|   2 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T3   |    21 |   210 |3   (0)| 00:00:01 |</code>

<code>|   3 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T2   |    11 |   110 |3   (0)| 00:00:01 |</code>

用leading(t3) use_hash(t2)也可以同样达到目的:

<code>select</code> <code>/*+ leading(t3) use_hash(t2) */ t2.object_name,t3.object_type</code>

由此可见在两个表关联的时候,可以用其他hint代替swap_join_inputs来达到相同的目的:

那么多表关联呢:

<code>select</code> <code>/*+ ordered use_hash(t3) */ t1.owner,t2.object_name,t3.object_type</code>

<code>  </code><code>2  </code><code>from</code> <code>t2,t3,t1 </code><code>where</code> <code>t2.object_id=t3.object_id </code><code>and</code> <code>t1.object_type=t3.object_type;</code>

<code>Plan hash value: 98820498</code>

<code>----------------------------------------------------------------------------</code>

<code>| Id  | Operation    | </code><code>Name</code> <code>| </code><code>Rows</code>  <code>| Bytes | Cost (%CPU)| </code><code>Time</code>   <code>|</code>

<code>|   0 | </code><code>SELECT</code> <code>STATEMENT    |   | 4 |   120 | 9   (0)| 00:00:01 |</code>

<code>|*  1 |  HASH </code><code>JOIN</code>    <code>|   | 4 |   120 | 9   (0)| 00:00:01 |</code>

<code>|*  2 |   HASH </code><code>JOIN</code>    <code>|   |11 |   220 | 6   (0)| 00:00:01 |</code>

<code>|   3 |    </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T2   |11 |   110 | 3   (0)| 00:00:01 |</code>

<code>|   4 |    </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T3   |21 |   210 | 3   (0)| 00:00:01 |</code>

<code>|   5 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code> <code>| T1   | 1 |10 | 3   (0)| 00:00:01 |</code>

<code>   </code><code>1 - access(</code><code>"T1"</code><code>.</code><code>"OBJECT_TYPE"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_TYPE"</code><code>)</code>

<code>   </code><code>2 - access(</code><code>"T2"</code><code>.</code><code>"OBJECT_ID"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_ID"</code>

可以看到,现在上述sql的执行计划是先由表T2和表T3做哈希连接,然后将他们做哈希连接的连接结果集再和表T1做一次哈希连接。

表T1的记录数为1,表T2的记录数为11,表T3的记录数为21,所以当表的T2和T3做哈希连接时,记录数多的表T3应该是被驱动表,这是因为我们在上述sql中使用了ordered hint和use_hash HINT指定表T3作为表T2和T3连接的时的被驱动表,所以oracle这里选择了表T2和T3做哈希连接,并且选择了表T3作为该哈希连接的被驱动表,这是没有问题的,现在问题在于表T1的记录数仅为1,所以当表T2和T3做哈希连接的结果再和表T1做哈希连接时,表T1应该是驱动表,而不是在上述执行计划里显示的那样作为第二个哈希连接的被驱动表。

使用下面HINT:

<code>  </code><code>2  </code><code>from</code> <code>t1,t2,t3 </code><code>where</code> <code>t2.object_id=t3.object_id </code><code>and</code> <code>t1.object_type=t3.object_type;</code>

<code>Plan hash value: 38266800</code>

<code>------------------------------------------------------------------------------</code>

<code>| Id  | Operation      | </code><code>Name</code> <code>| </code><code>Rows</code>  <code>| Bytes | Cost (%CPU)| </code><code>Time</code>     <code>|</code>

<code>|   0 | </code><code>SELECT</code> <code>STATEMENT      |      |   4 | 120 |   9   (0)| 00:00:01 |</code>

<code>|*  1 |  HASH </code><code>JOIN</code>      <code>|      |   4 | 120 |   9   (0)| 00:00:01 |</code>

<code>|   2 |   MERGE </code><code>JOIN</code> <code>CARTESIAN|      |  11 | 220 |   6   (0)| 00:00:01 |</code>

<code>|   3 |    </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code>  <code>| T1   |   1 |  10 |   3   (0)| 00:00:01 |</code>

<code>|   4 |    BUFFER SORT      |      |  11 | 110 |   3   (0)| 00:00:01 |</code>

<code>|   5 |     </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code> <code>| T2   |  11 | 110 |   3   (0)| 00:00:01 |</code>

<code>|   6 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code>   <code>| T3   |  21 | 210 |   3   (0)| 00:00:01 |</code>

<code>   </code><code>1 - access(</code><code>"T2"</code><code>.</code><code>"OBJECT_ID"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_ID"</code> <code>AND</code>

<code>      </code><code>"T1"</code><code>.</code><code>"OBJECT_TYPE"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_TYPE"</code><code>)</code>

<code>select</code> <code>/*+ leading(t1) use_hash(t3) */ t1.owner,t2.object_name,t3.object_type</code>

<code>Plan hash value: 2308542799</code>

<code>|   0 | </code><code>SELECT</code> <code>STATEMENT    |   | 7 |   210 | 9   (0)| 00:00:01 |</code>

<code>|*  1 |  HASH </code><code>JOIN</code>    <code>|   | 7 |   210 | 9   (0)| 00:00:01 |</code>

<code>|*  2 |   HASH </code><code>JOIN</code>    <code>|   | 7 |   140 | 6   (0)| 00:00:01 |</code>

<code>|   3 |    </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T1   | 1 |10 | 3   (0)| 00:00:01 |</code>

<code>|   5 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code> <code>| T2   |11 |   110 | 3   (0)| 00:00:01 |</code>

<code>   </code><code>2 - access(</code><code>"T1"</code><code>.</code><code>"OBJECT_TYPE"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_TYPE"</code><code>)</code>

加入以下hint,就解决:

<code>SELECT</code> <code>/*+ ordered use_hash(t3) swap_join_inputs(t1) */</code>

<code> </code><code>t1.owner, t2.object_name, t3.object_type</code>

<code>  </code><code>FROM</code> <code>t2, t3, t1</code>

<code> </code><code>WHERE</code> <code>t2.object_id = t3.object_id</code>

<code>  </code><code>5     </code><code>AND</code> <code>t1.object_type = t3.object_type;</code>

<code>Plan hash value: 3071514789</code>

<code>|   2 |   </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code> <code>| T1   | 1 |10 | 3   (0)| 00:00:01 |</code>

<code>|*  3 |   HASH </code><code>JOIN</code>    <code>|   |11 |   220 | 6   (0)| 00:00:01 |</code>

<code>|   4 |    </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T2   |11 |   110 | 3   (0)| 00:00:01 |</code>

<code>|   5 |    </code><code>TABLE</code> <code>ACCESS </code><code>FULL</code><code>| T3   |21 |   210 | 3   (0)| 00:00:01 |</code>

<code>   </code><code>3 - access(</code><code>"T2"</code><code>.</code><code>"OBJECT_ID"</code><code>=</code><code>"T3"</code><code>.</code><code>"OBJECT_ID"</code><code>)</code>

转:http://7642644.blog.51cto.com/7632644/1699902

文章可以转载,必须以链接形式标明出处。

本文转自 张冲andy 博客园博客,原文链接:  http://www.cnblogs.com/andy6/p/6790184.html ,如需转载请自行联系原作者