今天做完了Physical Computing这门课最后一个lab作业,接下来就要开始做最后的project了。这段时间我们在学classification,通过MATLAB这个软件来识别图像和声音。今天的这个作业就是通过分析元音字母'a'和元音字母'u'的不同频率,最后能够在我输入新的音频的时候自动识别这两个不同的元音字母。比如通过第一次输入这两个音频分析,我们发现'a'的频率在1000赫兹左右, 'u'的频率在400赫兹左右。之后再输入新的音频的时候,我们只需要在储存音频的vector里面找到最大的一个值和它的位置,然后在通过这个位置找到在最高峰的频率。如果这个最高峰的频率在一定的range,比如说在900到1600以内,就可以判定这个音频是'a';如果最高峰的频率在200到500以内,就可以判定这个音频是'u'。不过我今天做的这个function只能够识别'a'和'u'这两个元音,缺点是在我所规定的这个频率范围里面并不仅仅只有'a'和'u'可以符合,如果用户输入了不同于这两个元音的其它音频,而这个音频又恰恰在我所规定的频率范围内,那么我的这个function就无法正确的识别音频。
今天做的这个简易的speech recognition只是最最基础的东西,之后我们的project决定做一个升级版本的speech recognition。而要识别不同的单词的话需要考虑的应该就不仅仅是在最高峰的频率了。学了这个之后才感受到平时生活中用到的语音识别助手,比如说Siri,在识别我们每一句话的时候在后台所运行的东西不知道有多么复杂。语音识别这一方面是很有趣的,如果能够让一个机器人识别我的语言,然后按照我给出的指令做出我想要它做的事情,就会感觉自己和这个机器人之间搭建了某种联系,而我自己也非常明白这个联系是如何搭建起来的。
晚上做完作业之后差不多九点钟吧,感觉特别饿,冰箱里也啥都没有了,然后我就突发奇想想去超市一趟。我问了一下我朋友超市现在关门没有,她告诉我说还没有,十点钟才关门。之后我犹豫了一下,在她说可以陪我去之后我就决定去了。穿好羽绒服,戴好帽子,围上围巾之后,我就出门踏入初冬的冷风和无尽的黑夜之中了。这么晚出门去超市还是我来荷兰以后第一次,我本来以为现在这么晚外面应该都没什么人了,出来后才发现还有很多人,陆陆续续有骑着自行车的人从外面回来,和骑着自行车的人从我住的区域出去。外面的路灯很亮,在外面走着也没有什么害怕的感觉,风吹着凉凉的觉得还挺舒服的。到了超市之后我发现人还不少,超市外面还停了十几辆自行车。偶尔像这样来个夜间散步也还是很不错的,在晚上把这周的作业全做完了之后出去也感觉心情特别的舒畅。期待新的一天。
Pg. 79 《论语|辜鸿铭》子曰:"德不孤,必有邻"
Pg. 118《好好学习》"为什么临界知识能四两拔千斤"
每日记录
起床时间:早上8点
自主学习总时间:4小时
游戏总时间:0小时