下面内容大部分来自于尚硅谷教育宋红康老师的笔记,自己再整理出来方便自己查看
String的概述
String:字符串,使用一对 " " 引起来表示。
1.String声明为final的,不可被继承
2.String实现了Serializable接口:表示字符串是支持序列化的。
3.实现了Comparable接口:表示String可以比较大小。
4.String内部定义了final char[] value用于存储字符串数据
5.通过字面量的方式(区别于new给一个字符串赋值,此时的字符串值声明在字符串常量池中)。
6.字符串常量池中是不会存储相同内容(使用String类的equals()比较,返回true)的字符串的。
String的不可变性
1.当对字符串重新赋值时,需要重写指定内存区域赋值,不能使用原有的value进行赋值。
2.当对现的字符串进行连接操作时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
3.当调用String的replace()方法修改指定字符或字符串时,也需要重新指定内存区域赋值,不能使用原有的value进行赋值。
String拼接的方式说明
1.常量与常量的拼接结果在常量池。且常量池中不会存在相同内容的常量。
2.只要其中一个是变量,结果就在堆中。
3.如果拼接的结果调用intern()方法,返回值就在常量池中
intern()的使用
String s1 = "abc";
String s2 = "123";
String s3 = "abc123";
String s4 = "abc" + s2;
System.out.println(s3 == s4);//false
System.out.println(s3 == s4.intern());//true
String的常用方法
int length():返回字符串的长度: return value.length
char charAt(int index): 返回某索引处的字符return value[index]
boolean isEmpty():判断是否是空字符串:return value.length == 0
String toLowerCase():使用默认语言环境,将 String 中的所字符转换为小写
String toUpperCase():使用默认语言环境,将 String 中的所字符转换为大写
String trim():返回字符串的副本,忽略前导空白和尾部空白
boolean equals(Object obj):比较字符串的内容是否相同
boolean equalsIgnoreCase(String anotherString):与equals方法类似,忽略大小写
String concat(String str):将指定字符串连接到此字符串的结尾。 等价于用“+”
int compareTo(String anotherString):比较两个字符串的大小
String substring(int beginIndex):返回一个新的字符串,它是此字符串的从beginIndex开始截取到最后的一个子字符串。
String substring(int beginIndex, int endIndex) :返回一个新字符串,它是此字符串从beginIndex开始截取到endIndex(不包含)的一个子字符串。
boolean endsWith(String suffix):测试此字符串是否以指定的后缀结束
boolean startsWith(String prefix):测试此字符串是否以指定的前缀开始
boolean startsWith(String prefix, int toffset):测试此字符串从指定索引开始的子字符串是否以指定前缀开始
boolean contains(CharSequence s):当且仅当此字符串包含指定的 char 值序列时,返回 true
int indexOf(String str):返回指定子字符串在此字符串中第一次出现处的索引
int indexOf(String str, int fromIndex):返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始
int lastIndexOf(String str):返回指定子字符串在此字符串中最右边出现处的索引
int lastIndexOf(String str, int fromIndex):返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索
注:indexOf和lastIndexOf方法如果未找到都是返回-1
替换:
String replace(char oldChar, char newChar):返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所 oldChar 得到的。
String replace(CharSequence target, CharSequence replacement):使用指定的字面值替换序列替换此字符串所匹配字面值目标序列的子字符串。
String replaceAll(String regex, String replacement):使用给定的 replacement 替换此字符串所匹配给定的正则表达式的子字符串。
String replaceFirst(String regex, String replacement):使用给定的 replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。
匹配:
boolean matches(String regex):告知此字符串是否匹配给定的正则表达式。
切片:
String[] split(String regex):根据给定正则表达式的匹配拆分此字符串。
String[] split(String regex, int limit):根据匹配给定的正则表达式来拆分此字符串,最多不超过limit个,如果超过了,剩下的全部都放到最后一个元素中。
String与基本数据类型的转换
String --> 基本数据类型、包装类:调用包装类的静态方法:parseXxx(str)
基本数据类型、包装类 --> String:调用String重载的valueOf(xxx)
//String-->基本数据类型、包装类
String s1 = "123";
int i = Integer.parseInt(s1);
System.out.println(i + 123);//246
//基本数据类型、包装类-->String
String s2 = 222 + "";
System.out.println(s2 + 111);//222111
String s3 = String.valueOf(12345);
System.out.println(s3 + 222);//12345222
String与char[]之间的转换
String --> char[]:调用String的toCharArray()
char[] --> String:调用String的构造器
//String --> char[]
String str1 = "abc123";
char[] charArray = str1.toCharArray();
for (int i = 0; i < charArray.length; i++) {
System.out.println(charArray[i]);//abc123
}
//char[] --> String
char[] arr = new char[]{'h', 'e', 'l', 'l', 'o'};
String str2 = new String(arr);
System.out.println(str2);//hello
String与byte[]之间的转换(编码与解码)
编码:String --> byte[]:调用String的getBytes()
解码:byte[] --> String:调用String的构造器
说明:解码时,要求解码使用的字符集必须与编码时使用的字符集一致,否则会出现乱码。
public void test3() throws UnsupportedEncodingException {
String s1 = "abc123中国";
//编码
byte[] bytes = s1.getBytes();//()内空的表示使用默认的字符集编码,也可以在()指定字符集进行编码;默认使用的字符集一般为UTF-8
byte[] bytes1 = s1.getBytes("gbk");//使用gbk字符集进行编码
System.out.println(Arrays.toString(bytes));//[97, 98, 99, 49, 50, 51, -28, -72, -83, -27, -101, -67]
System.out.println(Arrays.toString(bytes1));//[97, 98, 99, 49, 50, 51, -42, -48, -71, -6]
//解码
String s2 = new String(bytes);//使用默认的字符集解码
String s3 = new String(bytes1);
System.out.println(s2);//abc123中国;没有出现乱码原因:编码集与解码集一致,都是使用磨人的UTF-8
System.out.println(s3);//abc123�й�;出现乱码原因:编码集与解码集不一致
String s4 = new String(bytes1, "gbk");//使用指定的解码集解码
System.out.println(s4);//abc123中国;编码集与解码集一致,没有出现乱码
}
StringBuffer与StringBuilder
StringBuffer与StringBuilder类似,下面将以StringBuffer为例,StringBuilder的用法与StringBuffer一样。StringBuffer与StringBuilder的区别就是StringBuffer是线程安全的,执行效率较低;StringBuilder是线程不安全的,执行效率较高。使用中看具体情况选择使用。
- java . StringBuffer代表可变的字符序列,JDK1.0中声明,可以对字符串内容进行增删,此时不会产生新的对象。
- 很多方法与String相同。
- 作为参数传递时,方法内部可以改变值。
StringBuffer 类不同于String ,其对象必须使用构造器生成。有三个构造器:
- StringBuffer():初始 容量为16的字符串缓冲区
- StringBuffer(int size )):构造指定容量的字符串缓冲区,使用中如果已经确定需要多大容量的字符串,一般使用指定容量的字符串构造器,尽量减少扩容
- StringBuffer(String str )):将内容初始化为指定字符串内容
StringBuffer内存解析
StringBuffer sb1 = new StringBuffer();//char[] value = new char[16];底层创建了一个长度是16的数组。
System.out.println(sb1.length());//0
sb1.append('a');//value[0] = 'a';
sb1.append('b');//value[1] = 'b';
StringBuffer sb2 = new StringBuffer("abc");//char[] value = new char["abc".length() + 16];底层创建了一个长度是19的数组
扩容问题:如果要添加的数据底层数组盛不下了,那就需要扩容底层的数组。默认情况下,扩容为原来容量的2倍 + 2,同时将原数组中的元素复制到新的数组中。
三者的执行效率:StringBuilder > StringBuffer > String
StringBuffer、StringBuilder中的常用方法
增:append(xxx)
删:delete(int start,int end)
改:setCharAt(int n ,char ch) / replace(int start, int end, String str)
查:charAt(int n )
插:insert(int offset, xxx)
长度:length();
*遍历:for() + charAt() / toString()
String、StringBuffer、StringBuilder三者的对比
String:不可变的字符序列;底层使用char[]存储
StringBuffer:可变的字符序列;线程安全的,效率低;底层使用char[]存储
StringBuilder:可变的字符序列;jdk5.0新增的,线程不安全的,效率高;底层使用char[]存储