天天看点

Java 泛型 四 基本用法与类型擦除

java 在 1.5 引入了泛型机制,泛型本质是参数化类型,也就是说变量的类型是一个参数,在使用时再指定为具体类型。泛型可以用于类、接口、方法,通过使用泛型可以使代码更简单、安全。然而 java 中的泛型使用了类型擦除,所以只是伪泛型。这篇文章对泛型的使用以及存在的问题做个总结,主要参考自 《java 编程思想》。

这个系列的另外两篇文章:

如果有一个类 <code>holder</code> 用于包装一个变量,这个变量的类型可能是任意的,怎么编写 <code>holder</code> 呢?在没有泛型之前可以这样:

}

在 <code>holder1</code> 中,有一个用 <code>object</code> 引用的变量。因为任何类型都可以向上转型为 <code>object</code>,所以这个 <code>holder</code> 可以接受任何类型。在取出的时候 <code>holder</code> 只知道它保存的是一个 <code>object</code> 对象,所以要强制转换为对应的类型。在 <code>main</code> 方法中, <code>holder1</code> 先是保存了一个字符串,也就是 <code>string</code> 对象,接着又变为保存一个 <code>integer</code> 对象(参数 <code>1</code> 会自动装箱)。从 <code>holder</code> 中取出变量时强制转换已经比较麻烦,这里还要记住不同的类型,要是转错了就会出现运行时异常。

下面看看 <code>holder</code> 的泛型版本:

在 <code>holder2</code> 中, 变量 <code>a</code> 是一个参数化类型 <code>t</code>,<code>t</code> 只是一个标识,用其它字母也是可以的。创建 <code>holder2</code> 对象的时候,在尖括号中传入了参数 <code>t</code> 的类型,那么在这个对象中,所有出现 <code>t</code> 的地方相当于都用 <code>string</code> 替换了。现在的 <code>get</code> 的取出来的不是 <code>object</code> ,而是 <code>string</code> 对象,因此不需要类型转换。另外,当调用 <code>set</code> 时,只能传入 <code>string</code> 类型,否则编译无法通过。这就保证了 <code>holder2</code> 中的类型安全,避免由于不小心传入错误的类型。

通过上面的例子可以看出泛使得代码更简便、安全。引入泛型之后,java 库的一些类,比如常用的容器类也被改写为支持泛型,我们使用的时候都会传入参数类型,如:<code>arraylist&lt;integer&gt; list = arraylist&lt;&gt;();</code>。

泛型不仅可以针对类,还可以单独使某个方法是泛型的,举个例子:

<code>genericmethod</code> 类本身不是泛型的,创建它的对象的时候不需要传入泛型参数,但是它的方法 <code>f</code> 是泛型方法。在返回类型之前是它的参数标识 <code>&lt;k,v&gt;</code>,注意这里有两个泛型参数,所以泛型参数可以有多个。

调用泛型方法时可以不显式传入泛型参数,上面的调用就没有。这是因为编译器会使用参数类型推断,根据传入的实参的类型 (这里是 <code>integer</code> 和 <code>string</code>) 推断出 <code>k</code> 和 <code>v</code> 的类型。

java 的泛型使用了类型擦除机制,这个引来了很大的争议,以至于 java 的泛型功能受到限制,只能说是”伪泛型“。什么叫类型擦除呢?简单的说就是,类型参数只存在于编译期,在运行时,java 的虚拟机 ( jvm ) 并不知道泛型的存在。先看个例子:

上面的代码有两个不同的 <code>arraylist</code>:<code>arraylist&lt;integer&gt;</code> 和 <code>arraylist&lt;string&gt;</code>。在我们看来它们的参数化类型不同,一个保存整性,一个保存字符串。但是通过比较它们的 <code>class</code> 对象,上面的代码输出是 <code>true</code>。这说明在 jvm 看来它们是同一个类。而在 c++、c# 这些支持真泛型的语言中,它们就是不同的类。

泛型参数会擦除到它的第一个边界,比如说上面的 <code>holder2</code> 类,参数类型是一个单独的 <code>t</code>,那么就擦除到 <code>object</code>,相当于所有出现 <code>t</code> 的地方都用 <code>object</code> 替换。所以在 jvm 看来,保存的变量 <code>a</code> 还是 <code>object</code> 类型。之所以取出来自动就是我们传入的参数类型,这是因为编译器在编译生成的字节码文件中插入了类型转换的代码,不需要我们手动转型了。如果参数类型有边界那么就擦除到它的第一个边界,这个下一节再说。

擦除会出现一些问题,下面是一个例子:

上面的 <code>manipulator</code> 是一个泛型类,内部用一个泛型化的变量 <code>obj</code>,在 <code>manipulate</code> 方法中,调用了 <code>obj</code> 的方法 <code>f()</code>,但是这行代码无法编译。因为类型擦除,编译器不确定 <code>obj</code> 是否有 <code>f()</code> 方法。解决这个问题的方法是给 <code>t</code> 一个边界:

现在 <code>t</code> 的类型是 <code>&lt;t extends hasf&gt;</code>,这表示 <code>t</code> 必须是 <code>hasf</code> 或者 <code>hasf</code> 的导出类型。这样,调用 <code>f()</code> 方法才安全。<code>hasf</code> 就是 <code>t</code> 的边界,因此通过类型擦除后,所有出现 <code>t</code> 的

地方都用 <code>hasf</code> 替换。这样编译器就知道 <code>obj</code> 是有方法 <code>f()</code> 的。

但是这样就抵消了泛型带来的好处,上面的类完全可以改成这样:

所以泛型只有在比较复杂的类中才体现出作用。但是像 <code>&lt;t extends hasf&gt;</code> 这种形式的东西不是完全没有意义的。如果类中有一个返回 <code>t</code> 类型的方法,泛型就有用了,因为这样会返回准确类型。比如下面的例子:

这里的 <code>get()</code> 方法返回的是泛型参数的准确类型,而不是 <code>hasf</code>。

类型擦除导致泛型丧失了一些功能,任何在运行期需要知道确切类型的代码都无法工作。比如下面的例子:

通过 <code>new t()</code> 创建对象是不行的,一是由于类型擦除,二是由于编译器不知道 <code>t</code> 是否有默认的构造器。一种解决的办法是传递一个工厂对象并且通过它创建新的实例。

另一种解决的方法是利用模板设计模式:

具体类型的创建放到了子类继承父类时,在 <code>create</code> 方法中创建实际的类型并返回。

本文介绍了 java 泛型的使用,以及类型擦除相关的问题。一般情况下泛型的使用比较简单,但是某些情况下,尤其是自己编写使用泛型的类或者方法时要注意类型擦除的问题。接下来会介绍数组与泛型的关系以及通配符的使用。