天天看點

Android 簡單訊飛語音合成與語音聽寫

展示效果

Android 簡單訊飛語音合成與語音聽寫

訊飛語音開發內建位址http://www.xfyun.cn/ 解壓後的doc檔案夾下的msc develop 檔案中有詳細內建步驟

先注冊一個賬号

Android 簡單訊飛語音合成與語音聽寫

注冊成功後,點選自己的應用,點選下載下傳相關的SDK

Android 簡單訊飛語音合成與語音聽寫

SDK的頁面

Android 簡單訊飛語音合成與語音聽寫
Android 簡單訊飛語音合成與語音聽寫

下載下傳後将sdk解壓, 把案例導入工程中運作看看效果

Android 簡單訊飛語音合成與語音聽寫

将libs下的兩個jar包添加到libs目錄下, 将同路徑下的其它 .so檔案(與c進行互動)複制到main路徑下建立的 jniLibs(L要大寫)目錄下(别忘了jar包要add) , 将assert目錄拷貝到main目錄下 注意 : 這些都是自己建立的應用生成的, 在申請appid時就與自己的應用綁定了, 拷貝别人的是沒有用的

Android 簡單訊飛語音合成與語音聽寫

添權重限

<uses-permission android:name="android.permission.RECORD_AUDIO" />
    <uses-permission android:name="android.permission.INTERNET" />
    <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
    <uses-permission android:name="android.permission.ACCESS_WIFI_STATE" />
    <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE" />
    <uses-permission android:name="android.permission.READ_PHONE_STATE" />
    <uses-permission android:name="android.permission.ACCESS_FINE_LOCATION" />
    <uses-permission android:name="android.permission.READ_CONTACTS" />
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
    <uses-permission android:name="android.permission.WRITE_SETTINGS" />
    <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE" />
           

建立類 , 以下是代碼: initSpeech()方法下的APPID需要改成上面介紹中自己應用生成的appId

MainActivity

public class MainActivity extends Activity implements View.OnClickListener {

    private static final String TAG = MainActivity.class .getSimpleName();
    private EditText et_input;
    private Button btn_startspeech, btn_startspeektext ;

    // 用HashMap存儲聽寫結果
    private HashMap<String, String> mIatResults = new LinkedHashMap<String , String>();

    @Override
    protected void onCreate(Bundle savedInstanceState) {
        super .onCreate(savedInstanceState) ;
        initView() ;
        initSpeech() ;
    }

    private void initView() {
        setContentView(R.layout.activity_main) ;
        et_input = (EditText) findViewById(R.id.et_input );
        btn_startspeech = (Button) findViewById(R.id.btn_startspeech );
        btn_startspeektext = (Button) findViewById(R.id.btn_startspeektext );
        btn_startspeech .setOnClickListener(this) ;
        btn_startspeektext .setOnClickListener(this) ;
    }

    private void initSpeech() {
        // 将“12345678”替換成您申請的 APPID,申請位址: http://www.xfyun.cn
        // 請勿在 “ =”與 appid 之間添加任務空字元或者轉義符
        SpeechUtility. createUtility( this, SpeechConstant. APPID + "=56ffe0ae" ); 
    }

    @Override
    public void onClick(View v) {
        switch (v.getId()) {
            case R.id.btn_startspeech: //語音識别(把聲音轉文字)
                startSpeechDialog();
                break;
            case R.id. btn_startspeektext:// 語音合成(把文字轉聲音)
                speekText();
                break;
        }

    }

    private void speekText() {
        //1. 建立 SpeechSynthesizer 對象 , 第二個參數: 本地合成時傳 InitListener
        SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer( this, null);
//2.合成參數設定,詳見《 MSC Reference Manual》 SpeechSynthesizer 類
//設定發音人(更多線上發音人,使用者可參見 附錄 13.2
        mTts.setParameter(SpeechConstant. VOICE_NAME, "vixyun" ); // 設定發音人
        mTts.setParameter(SpeechConstant. SPEED, "50" );// 設定語速
        mTts.setParameter(SpeechConstant. VOLUME, "80" );// 設定音量,範圍 0~100
        mTts.setParameter(SpeechConstant. ENGINE_TYPE, SpeechConstant. TYPE_CLOUD); //設定雲端
//設定合成音頻儲存位置(可自定義儲存位置),儲存在 “./sdcard/iflytek.pcm”
//儲存在 SD 卡需要在 AndroidManifest.xml 添加寫 SD 卡權限
//僅支援儲存為 pcm 和 wav 格式, 如果不需要儲存合成音頻,注釋該行代碼
        mTts.setParameter(SpeechConstant. TTS_AUDIO_PATH, "./sdcard/iflytek.pcm" );
//3.開始合成
        mTts.startSpeaking( et_input.getText().toString(), new MySynthesizerListener()) ;

    }

    class MySynthesizerListener implements SynthesizerListener {

        @Override
        public void onSpeakBegin() {
            showTip(" 開始播放 ");
        }

        @Override
        public void onSpeakPaused() {
            showTip(" 暫停播放 ");
        }

        @Override
        public void onSpeakResumed() {
            showTip(" 繼續播放 ");
        }

        @Override
        public void onBufferProgress(int percent, int beginPos, int endPos ,
                                     String info) {
            // 合成進度
        }

        @Override
        public void onSpeakProgress(int percent, int beginPos, int endPos) {
            // 播放進度
        }

        @Override
        public void onCompleted(SpeechError error) {
            if (error == null) {
                showTip("播放完成 ");
            } else if (error != null ) {
                showTip(error.getPlainDescription( true));
            }
        }

        @Override
        public void onEvent(int eventType, int arg1 , int arg2, Bundle obj) {
            // 以下代碼用于擷取與雲端的會話 id,當業務出錯時将會話 id提供給技術支援人員,可用于查詢會話日志,定位出錯原因
            // 若使用本地能力,會話 id為null
            //if (SpeechEvent.EVENT_SESSION_ID == eventType) {
            //     String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);
            //     Log.d(TAG, "session id =" + sid);
            //}
        }
    }

    private void startSpeechDialog() {
        //1. 建立RecognizerDialog對象
        RecognizerDialog mDialog = new RecognizerDialog(this, new MyInitListener()) ;
        //2. 設定accent、 language等參數
        mDialog.setParameter(SpeechConstant. LANGUAGE, "zh_cn" );// 設定中文
        mDialog.setParameter(SpeechConstant. ACCENT, "mandarin" );
        // 若要将UI控件用于語義了解,必須添加以下參數設定,設定之後 onResult回調傳回将是語義了解
        // 結果
        // mDialog.setParameter("asr_sch", "1");
        // mDialog.setParameter("nlp_version", "2.0");
        //3.設定回調接口
        mDialog.setListener( new MyRecognizerDialogListener()) ;
        //4. 顯示dialog,接收語音輸入
        mDialog.show() ;
    }

    class MyRecognizerDialogListener implements RecognizerDialogListener {

        /**
         * @param results
         * @param isLast  是否說完了
         */
        @Override
        public void onResult(RecognizerResult results, boolean isLast) {
            String result = results.getResultString(); //為解析的
            showTip(result) ;
            System. out.println(" 沒有解析的 :" + result);

            String text = JsonParser.parseIatResult(result) ;//解析過後的
            System. out.println(" 解析後的 :" + text);

            String sn = null;
            // 讀取json結果中的 sn字段
            try {
                JSONObject resultJson = new JSONObject(results.getResultString()) ;
                sn = resultJson.optString("sn" );
            } catch (JSONException e) {
                e.printStackTrace();
            }

            mIatResults .put(sn, text) ;//沒有得到一句,添加到

            StringBuffer resultBuffer = new StringBuffer();
            for (String key : mIatResults.keySet()) {
                resultBuffer.append(mIatResults .get(key));
            }

            et_input.setText(resultBuffer.toString());// 設定輸入框的文本
            et_input .setSelection(et_input.length()) ;//把光标定位末尾
        }

        @Override
        public void onError(SpeechError speechError) {

        }
    }

    class MyInitListener implements InitListener {

        @Override
        public void onInit(int code) {
            if (code != ErrorCode.SUCCESS) {
                showTip("初始化失敗 ");
            }

        }
    }

    /**
     * 語音識别
     */
    private void startSpeech() {
        //1. 建立SpeechRecognizer對象,第二個參數: 本地識别時傳 InitListener
        SpeechRecognizer mIat = SpeechRecognizer.createRecognizer( this, null); //語音識别器
        //2. 設定聽寫參數,詳見《 MSC Reference Manual》 SpeechConstant類
        mIat.setParameter(SpeechConstant. DOMAIN, "iat" );// 短信和日常用語: iat (預設)
        mIat.setParameter(SpeechConstant. LANGUAGE, "zh_cn" );// 設定中文
        mIat.setParameter(SpeechConstant. ACCENT, "mandarin" );// 設定國語
        //3. 開始聽寫
        mIat.startListening( mRecoListener);
    }


    // 聽寫監聽器
    private RecognizerListener mRecoListener = new RecognizerListener() {
        // 聽寫結果回調接口 (傳回Json 格式結果,使用者可參見附錄 13.1);
//一般情況下會通過onResults接口多次傳回結果,完整的識别内容是多次結果的累加;
//關于解析Json的代碼可參見 Demo中JsonParser 類;
//isLast等于true 時會話結束。
        public void onResult(RecognizerResult results, boolean isLast) {
            Log.e (TAG, results.getResultString());
            System.out.println(results.getResultString()) ;
            showTip(results.getResultString()) ;
        }

        // 會話發生錯誤回調接口
        public void onError(SpeechError error) {
            showTip(error.getPlainDescription(true)) ;
            // 擷取錯誤碼描述
            Log. e(TAG, "error.getPlainDescription(true)==" + error.getPlainDescription(true ));
        }

        // 開始錄音
        public void onBeginOfSpeech() {
            showTip(" 開始錄音 ");
        }

        //volume 音量值0~30, data音頻資料
        public void onVolumeChanged(int volume, byte[] data) {
            showTip(" 聲音改變了 ");
        }

        // 結束錄音
        public void onEndOfSpeech() {
            showTip(" 結束錄音 ");
        }

        // 擴充用接口
        public void onEvent(int eventType, int arg1 , int arg2, Bundle obj) {
        }
    };

    private void showTip (String data) {
        Toast.makeText( this, data, Toast.LENGTH_SHORT).show() ;
    }
}
           

JsonParser

/**
* Json結果解析類
*/
public class JsonParser {

     public static String parseIatResult(String json) {
          StringBuffer ret = new StringBuffer() ;
          try {
              JSONTokener tokener = new JSONTokener(json) ;
              JSONObject joResult = new JSONObject(tokener) ;

              JSONArray words = joResult.getJSONArray("ws" );
              for (int i = ; i < words.length(); i++) {
                   // 轉寫結果詞,預設使用第一個結果
                                       JSONArray items = words.getJSONObject(i).getJSONArray("cw" );
                   JSONObject obj = items.getJSONObject( );
                   ret.append(obj.getString("w" ));
//                  如果需要多候選結果,解析數組其他字段
//                 for(int j = 0; j < items.length(); j++)
//                 {
//                      JSONObject obj = items.getJSONObject(j);
//                      ret.append(obj.getString("w"));
//                 }
              }
          } catch (Exception e) {
              e.printStackTrace();
          }
          return ret.toString();
     }

     public static String parseGrammarResult(String json) {
          StringBuffer ret = new StringBuffer() ;
          try {
              JSONTokener tokener = new JSONTokener(json) ;
              JSONObject joResult = new JSONObject(tokener) ;

              JSONArray words = joResult.getJSONArray("ws" );
              for (int i = ; i < words.length(); i++) {
                   JSONArray items = words.getJSONObject(i).getJSONArray("cw" );
                   for (int j = ; j < items.length() ; j++)
                   {
                        JSONObject obj = items.getJSONObject(j);
                        if (obj.getString("w").contains( "nomatch"))
                        {
                             ret.append( "沒有比對結果.") ;
                             return ret.toString();
                         }
                        ret.append( "【結果】" + obj.getString("w" ));
                         ret.append("【置信度】 " + obj.getInt("sc" ));
                         ret.append("\n ");
                   }
              }
          } catch (Exception e) {
              e.printStackTrace();
              ret.append(" 沒有比對結果 .");
          }
          return ret.toString();
     }

     public static String parseLocalGrammarResult(String json) {
          StringBuffer ret = new StringBuffer() ;
          try {
              JSONTokener tokener = new JSONTokener(json) ;
              JSONObject joResult = new JSONObject(tokener) ;

              JSONArray words = joResult.getJSONArray("ws" );
              for (int i = ; i < words.length(); i++) {
                   JSONArray items = words.getJSONObject(i).getJSONArray("cw" );
                   for (int j = ; j < items.length() ; j++)
                   {
                        JSONObject obj = items.getJSONObject(j);
                        if (obj.getString("w").contains( "nomatch"))
                        {
                             ret.append( "沒有比對結果.") ;
                             return ret.toString();
                         }
                        ret.append( "【結果】" + obj.getString("w" ));
                         ret.append("\n ");
                   }
              }
              ret.append("【置信度】 " + joResult.optInt("sc" ));

          } catch (Exception e) {
              e.printStackTrace();
              ret.append(" 沒有比對結果 .");
          }
          return ret.toString();
     }
}
           

布局檔案

<? xml version="1.0" encoding= "utf-8"?>
<LinearLayout xmlns:android= "http://schemas.android.com/apk/res/android"
    android :layout_width="match_parent"
    android :layout_height="match_parent"
    android :orientation="vertical"
    >

    <EditText
        android :id="@+id/et_input"
        android :layout_margin="10dp"
        android :layout_width="match_parent"
        android :layout_height="80dp"
        android :hint="請輸入文本資訊 ..." />


    <Button
        android :id="@+id/btn_startspeech"
        android :text="點選按鈕語音輸入 "
        android :layout_width="match_parent"
        android :layout_height="wrap_content" />

    <Button
        android :id="@+id/btn_startspeektext"
        android :text="語音合成(把文字轉聲音) "
        android :layout_width="match_parent"
        android :layout_height="wrap_content" />


</LinearLayout>
           

謝謝觀看,小編祝大家生活愉快!(多多關注小編,會有非常之多精彩分享哦!)