原文地址
http://blog.csdn.net/dfman1978/article/details/78468318
前言
目前使用语音输入越来越普遍。语音输入不仅高效,而且更加自然,符合人类的输入方式。在这里开发了一个汇率换算的 APP,展示了如何使用语音输入和语音识别。
APP简介
这个 APP可以识别用户的输入,然后返回结果,并使用自然语言读出来。
用户可以点击话筒图标,进行语音输入:“1元人民币兑换多少美元”。或者说“350泰铢兑换多少人民币”等等。结果也会通过语音读出来
功能实现
语音识别和语义理解都是通过Olami平台来实现的。这个需要去Olami平台进行注册,然后就可以免费试用了。官网的地址https://olami.ai,网站上有丰富的教学资源具体的使用可以查看相关的文档。OLAMI是由威盛电子(上海)有限公司人工智能软件研发团队推出的一个人工智能软件开发平台,提供包括自然语音交互技术在内的全方位人机交互解决方案,覆盖了众多垂直领域的语义通用场景。
语音的读取是使用了苹果的AVSpeechSynthesis库进行的。这个库的使用也很简单。这个库是在AVFoundation中
由于 Olami平台已经对汇率的计算结果进行了内置计算,所以代码里处理的就比较少了。代码的主要是处理传过来的json数据
- (void)onResult:(NSData *)result {
NSError *error;
__weak typeof(self) weakSelf = self;
NSDictionary *dic = [NSJSONSerialization JSONObjectWithData:result
options:NSJSONReadingMutableContainers
error:&error];
if (error) {
NSSLog(@"error is %@",error.localizedDescription);
}else{
NSString *jsonStr=[[NSString alloc]initWithData:result
encoding:NSUTF8StringEncoding];
NSLog(@"jsonStr is %@",jsonStr);
NSString *ok = [dic objectForKey:@"status"];
if ([ok isEqualToString:@"ok"]) {
NSDictionary *dicData = [dic objectForKey:@"data"];
NSDictionary *asr = [dicData objectForKey:@"asr"];
if (asr) {//如果asr不为空,说明目前是语音输入
[weakSelf processASR:asr];
}
NSDictionary *nli = [[dicData objectForKey:@"nli"] objectAtIndex:0];
NSDictionary *desc = [nli objectForKey:@"desc_obj"];
int status = [[desc objectForKey:@"status"] intValue];
if (status != 0) {// 0 说明状态正常,非零为状态不正常或者result为空
[[NSNotificationCenter defaultCenter] postNotification:[NSNotification notificationWithName:@"noresult" object:nil userInfo:nil]];
}else{
NSDictionary *semantic = [[nli objectForKey:@"semantic"]
objectAtIndex:0];
NSString *result = [desc objectForKey:@"result"];
[self.delegate onResult:result];
}
}else{
}
}
}
结果是放在 result字段中
{
"data": {
"asr": {
"result": "三百九十八港币是多少人民币",
"speech_status": 0,
"final": true,
"status": 0
},
"nli": [
{
"desc_obj": {
"result": "您要查找的信息:398港币兑换338.22040人民币",
"source_currency": "398港币",
"status": 0
},
"data_obj": [
{
"target_currency": "338.22040人民币"
}
],
"type": "exchangerate"
}
]
},
"status": "ok"
}
把这个字段中的值传出来就行了
具体的代码可以参考 GitHub