iOS自带文字转语音功能,实现很简单,接下来我们就一起来学习这个简单酷炫的功能。
要实现文字转语音,我们只需要简单的几个类,从本文你将学到:
- 将文字(汉语、英语等)转化为语音输出
- 掌握语音合成器:
AVSpeechSynthesizer
,
语言设置:AVSpeechSynthesisVoice
,
发声对象:AVSpeechUtterance
的使用 - 文字转语音demo
其合成过程如下:由
AVSpeechSynthesisVoice
设置语言环境,AVSpeechUtterance
设置需要转化的文字,并对语速、音调、音量等进行控制,最后由AVSpeechSynthesizer
来进行播放。
-
AVSpeechSynthesisVoice
- 1、创建语言环境
//参数为需要设置的语言
AVSpeechSynthesisVoice *voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"zh-TW"];
//获取当前设置的语言
[AVSpeechSynthesisVoice currentLanguageCode];
- 2、获取支持的语言
//通过如下方法可以查看所支持的语言,可根据需要从中选取所需语言
NSArray *voices = [AVSpeechSynthesisVoice speechVoices];
常用语言如下:
en-GB//英语(英式)
en-US//英语(美式)
zh-CN//汉语(普通话)
zh-HK//汉语(粤语)
zh-TW//汉语(台湾)
-
AVSpeechUtterance
// 创建语音合成器
AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
// 实例化发声的对象
AVSpeechUtterance *utterance = [AVSpeechUtterance speechUtteranceWithString:@"我有一只小毛驴"];
//语言,为AVSpeechSynthesisVoice的一个对象
utterance.voice = voice;
//语速,0~1
utterance.rate = 0.5;
//声音,0~1
utterance.volume = 1;
//音调0.5~2
utterance.pitchMultiplier = 1;
//播放前的延时
utterance.preUtteranceDelay = 3;
//播放后的延时,一般用于设置连续播放多段文字的间隔
utterance.postUtteranceDelay = 1;
-
AVSpeechSynthesizer
- 使用
AVSpeechSynthesizer *synthesizer = [[AVSpeechSynthesizer alloc] init];
//播放
[synthesizer speakUtterance:utterance];
- 方法介绍
//开始播放
- (void)speakUtterance:(AVSpeechUtterance *)utterance;
//停止播放,调用此方法会立刻停止,并清空utterance队列
- (BOOL)stopSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//暂停播放
- (BOOL)pauseSpeakingAtBoundary:(AVSpeechBoundary)boundary;
//继续播放
- (BOOL)continueSpeaking;
需要说明的是调用speakUtterance:
方法时其实是把utterance添加到播放队列,synthesizer会从该队列里面顺序取出utterance逐个播放,也就是我们可以一次性添加多个utterance,播放时则会顺序播放。
- 3.代理方法,如有需要可以在代理 房中做一些处理
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didStartSpeechUtterance:(AVSpeechUtterance *)utterance {
NSLog(@"开始:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didPauseSpeechUtterance:(AVSpeechUtterance *)utterance {
NSLog(@"暂停:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didCancelSpeechUtterance:(AVSpeechUtterance *)utterance {
NSLog(@"取消:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer willSpeakRangeOfSpeechString:(NSRange)characterRange utterance:(AVSpeechUtterance *)utterance {
NSLog(@"将要开始:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didContinueSpeechUtterance:(AVSpeechUtterance *)utterance {
NSLog(@"继续:%@",utterance.speechString);
}
- (void)speechSynthesizer:(AVSpeechSynthesizer *)synthesizer didFinishSpeechUtterance:(AVSpeechUtterance *)utterance {
NSLog(@"完成:%@",utterance.speechString);
}
写了一个简单的demo
测试了一下,demo
中仅有两个类,FireSpeecher
用于播放控制,FireVoiceModely
用于设置需要播放低文字及相关属性的配置:
1 FireSpeecher
类:
typedef NS_ENUM(NSInteger, PauseType) {
PauseTypeImmediate,//立刻停止
PauseTypeByWord//读完本字(单词)后再停止
};
@interface FireSpeecher : NSObject
/**
暂停或者停止类型
*/
@property (nonatomic, assign) PauseType pauseType;
/**
初始化
@param models 需要转化的文字Model
@return FireSpeecher对象
*/
- (instancetype)initWithModels:(NSArray <FireVoiceModel *>*)models;
/**
播放
@return YES-->播放成功,NO-->播放失败
*/
- (BOOL)speech;
/**
暂停播放
@return YES-->暂停成功,NO-->暂停失败
*/
- (BOOL)pausedSpeech;
/**
停止
@return YES-->停止成功,NO-->停止失败
*/
- (BOOL)stopeSpeech;
/**
继续播放
@return YES-->继续播放成功,NO-->继续播放失败
*/
- (BOOL)contiueSpeech;
2 FireVoiceModel
类:
typedef NS_ENUM(NSInteger, LanguageType) {
LanguageTypeDefault,//默认(普通话)
LanguageTypeCH,//中文(普通话)
LanguageTypeHK,//香港(粤语)
LanguageTypeTW,//中文(台湾)
LanguageTypeUS,//英语(美式)
LanguageTypeEN//英语(英式)
};
@interface FireVoiceModel : NSObject
/**
要说的句子
*/
@property (nonatomic , copy) NSString *string;
/**
语言类型
*/
@property (nonatomic, assign) LanguageType languageType;
/**
说话速率,0~1,默认0.5
*/
@property (nonatomic, assign) CGFloat rate;
/**
音调,0.5~2.0,默认1.0
*/
@property (nonatomic, assign) CGFloat pinch;
/**
音量,0~1,默认为1
*/
@property (nonatomic, assign) CGFloat volume;
/**
说话前的时间,默认为0
*/
@property (nonatomic, assign) NSTimeInterval preDelay;
/**
说话后的延时时间,默认为0
*/
@property (nonatomic, assign) NSTimeInterval postDelay;
使用就很简单了,语言默认中文普通话,包括语速、音调可以在model中对每句话单独进行设置:
NSMutableArray *array = [NSMutableArray arrayWithCapacity:5];
for (int i = 0; i < 5; i ++) {
FireVoiceModel *model = [[FireVoiceModel alloc] init];
model.string = @"哈哈";
model.postDelay = 1;
[array addObject:model];
}
FireSpeecher *speecher = [[FireSpeecher alloc] initWithModels:array];
if ([speecher speech]) {
NSLog(@"开讲啦");
}else {
NSLog(@"出错啦");
}