实现百度语音识别。
首先去https://ai.baidu.com/sdk#asr下载语音识别sdk。
下载的demo能直接运行,用as打开,若是出现错误
Cause: unable to find valid certification path to requested target
需要把gradle文件里面的两个jcenter()改为
maven {
url "http://jcenter.bintray.com"
}
可以参照demo和文档https://ai.baidu.com/docs#/ASR-Android-SDK/ac212c02,将识别部分的代码分离出来。
新建一个helloworld。
第一步:将demo里面jar包bdasr_V3_20190515_c9eed5d.jar导入到helloworld的libs目录,将jniLibs直接复制过来。
第二步:manifest里,将权限和APP_ID,service那些加进来:
<uses-permission android:name="android.permission.RECORD_AUDIO" />
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.READ_PHONE_STATE" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
<meta-data
android:name="com.baidu.speech.APP_ID"
android:value="15590577"/>
<meta-data
android:name="com.baidu.speech.API_KEY"
android:value="q2uPyBe6LmWTZlvb0g1dzcHV"/>
<meta-data
android:name="com.baidu.speech.SECRET_KEY"
android:value="y7S7hAI894BB3LF1yHYmvQEus1B6wPvj"/>
<service android:name="com.baidu.speech.VoiceRecognitionService" android:exported="false" />
若是VoiceRecognitionService无法识别,在菜单中选择File > Invalidate Caches / Restart...,然后在弹出的对话框中选择Invalidate and Restart.,Android Studio会清除缓存且重启,重启后可以自动识别到导入的jar包
第三步:将IRecogListener.java,MyRecognizer.java,RecogEventAdapter.java,RecogResult.java四个文件复制过来。
准备工作已经做好,接下来,就可以在mainactivity里面用了。
将main.xml修改为:
<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
android:layout_width="fill_parent"
android:layout_height="fill_parent"
android:orientation="vertical">
<TextView
android:id="@+id/txtResult"
android:layout_width="match_parent"
android:layout_height="wrap_content"
android:padding="8dp"
android:textSize="18dp" />
<View
android:layout_width="match_parent"
android:layout_height="1dp"
android:background="#999" />
<ScrollView
android:layout_width="match_parent"
android:layout_height="match_parent"
android:layout_above="@+id/btn"
android:layout_weight="1">
<TextView
android:id="@+id/txtLog"
android:layout_width="match_parent"
android:layout_height="match_parent"
android:textSize="12dp" />
</ScrollView>
<Button
android:id="@+id/btn_stop"
android:layout_width="match_parent"
android:layout_height="wrap_content"
android:layout_alignParentBottom="true"
android:text="停止" />
<Button
android:id="@+id/btn"
android:layout_width="match_parent"
android:layout_height="wrap_content"
android:layout_alignParentBottom="true"
android:text="开始" />
</LinearLayout>
初始化布局和获取权限:
initView();
initPermission();
private void initView() {
txtResult = (TextView) findViewById(R.id.txtResult);
txtLog = (TextView) findViewById(R.id.txtLog);
btn = (Button) findViewById(R.id.btn);
stopBtn = (Button) findViewById(R.id.btn_stop);
txtLog.setText(DESC_TEXT + "\n");
}
/**
* android 6.0 以上需要动态申请权限
*/
private void initPermission() {
String permissions[] = {Manifest.permission.RECORD_AUDIO,
Manifest.permission.ACCESS_NETWORK_STATE,
Manifest.permission.INTERNET,
Manifest.permission.READ_PHONE_STATE,
Manifest.permission.WRITE_EXTERNAL_STORAGE
};
ArrayList<String> toApplyList = new ArrayList<String>();
for (String perm : permissions) {
if (PackageManager.PERMISSION_GRANTED != ContextCompat.checkSelfPermission(this, perm)) {
toApplyList.add(perm);
// 进入到这里代表没有权限.
}
}
String tmpList[] = new String[toApplyList.size()];
if (!toApplyList.isEmpty()) {
ActivityCompat.requestPermissions(this, toApplyList.toArray(tmpList), 123);
}
}
@Override
public void onRequestPermissionsResult(int requestCode, String[] permissions, int[] grantResults) {
// 此处为android 6.0以上动态授权的回调,用户自行实现。
}
创建MyRecognizer对象,用来调用开始录音结束录音,以及设置监听返回结果。
private MyRecognizer getAsrManager() {
if (asrManager == null) {
asrManager = new MyRecognizer(this, onAsrListener);
}
return asrManager;
}
这个onAsrListener,是自定义IRecogListener,用来获取RecogEventAdapter返回的结果。
private IRecogListener onAsrListener = new IRecogListener() {
@Override
public void onAsrReady() {
}
@Override
public void onAsrBegin() {
}
@Override
public void onAsrEnd() {
}
@Override
public void onAsrPartialResult(String[] results, RecogResult recogResult) {
}
@Override
public void onAsrOnlineNluResult(String nluResult) {
}
@Override
public void onAsrFinalResult(String[] results, RecogResult recogResult) {
txtResult.setText(results[0]);
}
@Override
public void onAsrFinish(RecogResult recogResult) {
}
@Override
public void onAsrFinishError(int errorCode, int subErrorCode, String descMessage, RecogResult recogResult) {
}
@Override
public void onAsrLongFinish() {
}
@Override
public void onAsrVolume(int volumePercent, int volume) {
}
@Override
public void onAsrAudio(byte[] data, int offset, int length) {
}
@Override
public void onAsrExit() {
}
@Override
public void onOfflineLoaded() {
}
@Override
public void onOfflineUnLoaded() {
}
};
MyRecognizer的构造方法需要修改为:
public MyRecognizer(Context context, IRecogListener listener) {
if (isInited) {
Log.e(TAG, "还未调用release(),请勿新建一个新类");
throw new RuntimeException("还未调用release(),请勿新建一个新类");
}
isInited = true;
// SDK集成步骤 初始化asr的EventManager示例,多次得到的类,只能选一个使用
asr = EventManagerFactory.create(context, "asr");
// SDK集成步骤 设置回调event, 识别引擎会回调这个类告知重要状态和识别结果
asr.registerListener(eventListener = new RecogEventAdapter(listener));
}
关键在asr.registerListener(eventListener = new RecogEventAdapter(listener));
这一步绑定了RecogEventAdapter,RecogEventAdapter里面获取到识别结果,然后通过listener返回到mainactivity。
接下来,只用调用开始和结束了。
getAsrManager().start(params);
getAsrManager().stop();
另外,说一句话后,会自动停止录音并识别,并不需要手动停止。
需要注意的有以下几点:
一个是params,可以按照dome里面的设置:
Map<String, Object> params = new LinkedHashMap<String, Object>();
params.put(SpeechConstant.ACCEPT_AUDIO_VOLUME, false);
二个是上面用了demo自带的appid,可以去https://console.bce.baidu.com/ai/?_=1574239041289&fromai=1#/ai/speech/app/create
创建一个自己包名的appid。
三个是appid的那三个meta-data代码,要放在manifest的application里面,一开始和uses-permission一起放在了外面,结果识别不出来,点击开始录音,还会异常停止录音,还跑去提交工单问为啥。。
以上是基于demo封装的helloworld,代码如下:
https://github.com/doudousang/baiduaduio.git
基于sdk封装的只需要一个类即可(识别结果自己处理):
https://github.com/doudousang/baiduaudiosdk.git
封装语音识别的总工程如下:
https://github.com/doudousang/GoHomeAudio.git
参考代码:
Android Studio出现:Cause: unable to find valid certification path to requested target
解决Android Studio 导入jar包后无法识别,找不到相关类的问题