天天看點

Java漢字排序(漢字轉拼音用pinyin4j)

package test;

import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;

/**
 * @className:PinyingUtil.java
 * @classDescription:拼音操作工具類
 * @author:xiayingjie
 * @createTime:2010-10-21
 */

public class PinyinUtil {

	/**
	 * 将字元串轉換成拼音數組
	 * 
	 * @param src
	 * @return
	 */
	public static String[] stringToPinyin(String src) {
		return stringToPinyin(src, false, null);
	}
	/**
	 * 将字元串轉換成拼音數組
	 * 
	 * @param src
	 * @return
	 */
	public static String[] stringToPinyin(String src,String separator) {
		return stringToPinyin(src, true, separator);
	}

	/**
	 * 将字元串轉換成拼音數組
	 * 
	 * @param src
	 * @param isPolyphone
	 *            是否查出多音字的所有拼音
	 * @param separator
	 *            多音字拼音之間的分隔符
	 * @return
	 */
	public static String[] stringToPinyin(String src, boolean isPolyphone,
			String separator) {
		// 判斷字元串是否為空
		if ("".equals(src) || null == src) {
			return null;
		}
		char[] srcChar = src.toCharArray();
		int srcCount = srcChar.length;
		String[] srcStr = new String[srcCount];

		for (int i = 0; i < srcCount; i++) {
			srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
		}
		return srcStr;
	}

	/**
	 * 将單個字元轉換成拼音
	 * 
	 * @param src
	 * @return
	 */
	public static String charToPinyin(char src, boolean isPolyphone,
			String separator) {
		// 建立漢語拼音處理類
		HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
		// 輸出設定,大小寫,音标方式
		defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
		defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);

		StringBuffer tempPinying = new StringBuffer();
		

		// 如果是中文
		if (src > 128) {
			try {
				// 轉換得出結果
				String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
						defaultFormat);
				
						
				// 是否查出多音字,預設是查出多音字的第一個字元
				if (isPolyphone && null != separator) {
					for (int i = 0; i < strs.length; i++) {
						tempPinying.append(strs[i]);
						if (strs.length != (i + 1)) {
							// 多音字之間用特殊符号間隔起來
							tempPinying.append(separator);
						}
					}
				} else {
					tempPinying.append(strs[0]);
				}

			} catch (BadHanyuPinyinOutputFormatCombination e) {
				e.printStackTrace();
			}
		} else {
			tempPinying.append(src);
		}

		return tempPinying.toString();

	}

	
	public static String hanziToPinyin(String hanzi){
		return hanziToPinyin(hanzi," ");
	}
	/**
	 * 将漢字轉換成拼音
	 * @param hanzi
	 * @param separator
	 * @return
	 */
	@SuppressWarnings("deprecation")
  public static String hanziToPinyin(String hanzi,String separator){
			// 建立漢語拼音處理類
			HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
			// 輸出設定,大小寫,音标方式
			defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
			defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
			
			String pinyingStr="";
			try {
				pinyingStr=PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator);
			} catch (BadHanyuPinyinOutputFormatCombination e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}	
			return pinyingStr;
	}
	/**
	 * 将字元串數組轉換成字元串
	 * @param str 
	 * @param separator 各個字元串之間的分隔符
	 * @return
	 */
	public static String stringArrayToString(String[] str, String separator) {
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < str.length; i++) {
			sb.append(str[i]);
			if (str.length != (i + 1)) {
				sb.append(separator);
			}
		}
		return sb.toString();
	}
	/**
	 * 簡單的将各個字元數組之間連接配接起來
	 * @param str
	 * @return
	 */
	public  static String stringArrayToString(String[] str){
		return stringArrayToString(str,"");
	}
	/**
	 * 将字元數組轉換成字元串
	 * @param str 
	 * @param separator 各個字元串之間的分隔符
	 * @return
	 */
	public static String charArrayToString(char[] ch, String separator) {
		StringBuffer sb = new StringBuffer();
		for (int i = 0; i < ch.length; i++) {
			sb.append(ch[i]);
			if (ch.length != (i + 1)) {
				sb.append(separator);
			}
		}
		return sb.toString();
	}
	
	/**
	 * 将字元數組轉換成字元串
	 * @param str 
	 * @return
	 */
	public static String charArrayToString(char[] ch) {
		return charArrayToString(ch," ");
	}

	/**
	 * 取漢字的首字母
	 * @param src
	 * @param isCapital 是否是大寫
	 * @return
	 */
	public static char[]  getHeadByChar(char src,boolean isCapital){
		//如果不是漢字直接傳回
		if (src <= 128) {
			return new char[]{src};
		}
		//擷取所有的拼音
		String []pinyingStr=PinyinHelper.toHanyuPinyinStringArray(src);
		
		//建立傳回對象
		int polyphoneSize=pinyingStr.length;
		char [] headChars=new char[polyphoneSize];
		int i=0;
		//截取首字元
		for(String s:pinyingStr){
			char headChar=s.charAt(0);
			//首字母是否大寫,預設是小寫
			if(isCapital){
				headChars[i]=Character.toUpperCase(headChar);
			 }else{
				headChars[i]=headChar;
			 }
			i++;
		}
		
		return headChars;
	}
	/**
	 * 取漢字的首字母(預設是大寫)
	 * @param src
	 * @return
	 */
	public static char[]  getHeadByChar(char src){
		return getHeadByChar(src,true);
	}
	/**
	 * 查找字元串首字母
	 * @param src 
	 * @return
	 */
	public  static String[] getHeadByString(String src){
		return getHeadByString( src, true);
	}
	/**
	 * 查找字元串首字母
	 * @param src 
	 * @param isCapital 是否大寫
	 * @return
	 */
	public  static String[] getHeadByString(String src,boolean isCapital){
		return getHeadByString( src, isCapital,null);
	}
	/**
	 * 查找字元串首字母
	 * @param src 
	 * @param isCapital 是否大寫
	 * @param separator 分隔符
	 * @return
	 */
	public  static String[] getHeadByString(String src,boolean isCapital,String separator){
		char[]chars=src.toCharArray();
		String[] headString=new String[chars.length];
		int i=0;
		for(char ch:chars){
			
			char[]chs=getHeadByChar(ch,isCapital);
			StringBuffer sb=new StringBuffer();
			if(null!=separator){
				int j=1;
				
				for(char ch1:chs){
					sb.append(ch1);
					if(j!=chs.length){
						sb.append(separator);
					}
					j++;
				}
			}else{
				sb.append(chs[0]);
			}
			headString[i]=sb.toString();
			i++;
		}
		return headString;
	}
	
	public static void main(String[] args) {
		System.out.println(PinyinUtil.stringArrayToString(getHeadByString("我的心肝愛上"),"-"));
		
	}

}

      

上面這個pinyinUtil類是pinyin4j包中的一個工具類,有多種方法供大家使用。

User類,相信不用再貼出來了,大家懂的。。。

下面這個類是實作排序的類了。

package test;

import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;

public class HanZiSort {
  public static void main(String[] args) {
    List<User> list=new ArrayList<User>();
    User u=new User();
    u.setName("張三");
    u.setAge(21);
    list.add(u);
    
    u=new User();
    u.setName("李四");
    u.setAge(18);
    list.add(u);
    
    u=new User();
    u.setName("王五");
    u.setAge(25);
    list.add(u);
    
    u=new User();
    u.setName("寒子");
    u.setAge(89);
    list.add(u);
    
    for(User user: list) {
      System.out.println(PinyinUtil.hanziToPinyin(user.getName()));
    }
    Collections.sort(list, new ToSort());//new ToSort() 根據需求定義排序
    System.out.println("排序後!!!!!!!!!");
    for(User user: list) {
      System.out.println(PinyinUtil.hanziToPinyin(user.getName()));
    }
  }
}
//排序
class ToSort implements Comparator<User> {
  @Override
  public int compare(User o1, User o2) {
    // TODO Auto-generated method stub
    String s1=PinyinUtil.hanziToPinyin(o1.getName());
    String s2=PinyinUtil.hanziToPinyin(o2.getName());
    if(s1.compareTo(s2)>0) {
      return 1;
    } else {
      return -1;
    }
  }
}
           

結果:

zhang san
li si
wang wu
han zi
排序後!!!!!!!!!
han zi
li si
wang wu
zhang san
           

pinyin4j包在附件中。