Praat 语音标注

Praat 语音学软件,原名Praat: doing phonetics by computer,通常简称 Praat,是一款跨平台的多功能语音学专业软件,主要用于对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和文字报表。

一、Mac 版 Praat 软件的安装

访问官网,下载相应的版本,本实验下载的 Macintosh 版(即Mac 版),官网有详细的安装步骤,概括为:
(1)磁盘映像文件;
(2)下载字体包;

二、Praat 软件的使用

  1. 导入语音文件
    点击 praat —>open —> read from file —> 找到你打开的文件 —> 打 开,文件被添加在了praat 中;
  2. 生成 TextGrid 文件
    选中要转写的语音文件 —> annotate - —> To TextGrid... —>语音文件分层(三层)如下图:


    分层.png

    点击 OK 生成 TextGrid 文件;

  3. 编辑语音和 TextGrid 文件
    同时选中语音文件和 TextGrid 文件 —> View & Edit;如图:


    转写界面.png

三、标注语音文件

(一)时间边界定位
  • 按 Tab 键可以播放语音,再次按 Tab 键可以停止播放语音;

  • command + i:可以放大波形,
    command + o:可以缩小波形,
    command + s可以保存 TextGrid 文件;

  • 添加时间边界的方法为:将鼠标移动到语音波形的相应位置,这时会出现一条虚线以及圆圈,分别点击 SPEAKER 层和 CONTENT
    层对应的圆圈即可。在整个语音文件中,SPEAKER 层和 CONTENT
    层的时间边界的数目是完全一致的,每一对时间边界也是完全相等的。

    请注意,SPEAKER 层和 CONTENT 层的时间边界必须保持一致。也就是说不管点击哪一层的时间边界,另外一层一定是空心蓝色,而不是实心蓝色。

(二)标注全局文件

GLOBAL 层主要标注语音文件的一些全局信息,包括说话人性别信息和语种信息(方言区)。标注格式如下:

[speaker]:[空格]1[空格]性别,[空格]2[空格]性别;[空格][language]:[空格]1[空格]方言区,[空格]2[空格]方言区
例如:[speaker]: 1 male, 2 female; [language]: 1 普通话, 2 普通话
  • SPEAKER 层需要标注的是说话人信息,“说话人”取值为以下两种:1、2,分别表示说话人1、说话人2。(说话人1、2仅标注在文字段上,符号段不标注);
  • 如果是客服类对话,则 SPEAKER 层的“说话人”取值为1的语音,必须是话务员;用户的语音取值为2;
  • 客服定义为奇数,用户为偶数;(客服一定是和用户有直接对话,否则不算客服)。
(三)CONENT 层的语音标注
  1. CONTENT 层正常语音的标注:
    (1)数字的标注,用简体中文;

    例如:
    “27” → “二十七”;
    “我的电话是2381832” → “我的电话是二三八幺八三二
    

    (2)注意边界线:两层始终对齐;
    (3)交叉语音:SPEAKER 层不标注内容,CONTENT 层标注“+”;
    (4)边界线导致的半个语音:可用 [*] 或 [UNK] 来表示;[*] 和 [UNK] 取决于是单段的听不清,还是在语音中听不清;
    (5)每个时间段的长度最多不能超过 8s,也不能太短,一般在 5-6秒;
    (6)可舍弃包含不进来的字;
    (7)英文内容标注:

    例如:
    “网址是三w点sina点com”;     
    “二三八幺八三二艾特qq点com”;(不要写@)      
    “请以井号键结束”;(不要写#)
    

    (8)英文内容标注:每个字母中间用空格隔开

    例如:good表示单词读音,g o o d则表示字母读音。
    例如:我的编号是f m s幺三二
    

    (9)“恩、阿” 统一用口字旁的。

  2. 噪音的标注:
    CONTENT层短暂噪音的标注:
    所有此类标注都是中括号与语音内容的组合,不要标注时间边界。
    (1)听不清的一个字/英文单词直接在句子中标注 [UNK];

    例如:二三八幺八[UNK]二
    

    (2)两个或者两个以上听不懂的字,标注[*] ;

    例如:听不清的长句、方言、大段的英文句子、拿着话筒和其他人说话
    

    (3)短暂的笑声:直接在句子中标注 [LAUGH];
    (4)短暂的由说话人发出的干扰浊音:直接在句子中标注
    [SONANT];

    例如:咳嗽声、打喷嚏、清嗓子
    

    (5)系统播出的语音提示:[PROMPT] 系统自动播放的语音内容,而非说话人的语音内容(第二层不用标说话人);

    例如:[PROMPT] 欢迎致电我公司现在由一号客服代表为您服务
    

    CONTENT层持续噪音的标注
    需要标注中括号和时间边界,SPEAKER层不标注内容
    (1)明显的静音段(大于500ms):[SIL]
    (如果空白段没有任何声音,可以空着,后期技术处理)
    (2)各种垃圾声音:[ENS]

    例如:连续的拍桌子、连续的敲击声、持续的各种环境噪音(大于500ms)
    

    (3)连续的笑声:[LAUGH]
    (4)持续的音乐声:[MUSIC]

    例如:
        · 唱歌声(有歌词和旋律) 
        · 哼唱(没有歌词,但有旋律) 
        · 口哨声  
        · 可能是别人唱歌、演奏,也可能是背景的电视、收音机发出的音  乐和歌声
        · 口哨声  
        · 包括持续时间较长的彩铃声
    

    (5)录音及电信系统引起的噪声:[SYSTEM]
    包括电话按键音dtmf、电话忙音 beap、录音系统的其他噪音等,都是通信系统主动发出的声音,而不是摘机、挂机或干扰带来的咔啦或呲呲杂音。

    一般会用的噪音符号:+,[*],[ENS],[UNK],[SONANT],[LAUGH],[PROMPT],[SYSTEM] 
    
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容