解密打字速度

1 打字速度

对许多人来说,打字速度是个谜。这里的谜有三层意思:迷信、迷惑、迷失!迷信者盲目崇拜打字飞快的高手,希望有朝一日也取得同样的成就。迷惑者觉得有些人演示的速度太离谱、不可信,但又不知道是为什么。迷失者对自己感到失望,怀疑自己的能力,甚至觉得自己是个笨蛋,为什么我同排行榜上的打字高手差距那么大?

这个迷怎么破?让我慢慢道来。首先,我们要弄清打字速度究竟是什么。怎么定义打字速度呢?打字速度 s 的计算公式如下:

s = r ÷ l,

其中,s 是指每分钟输入的字数,即打字速度,简称为字速,单位为字 / 分;r 是指每分钟的击键次数,称为键速,单位为键 / 分;l 是指平均每个字的用键数,包括空格、选择键、翻页键等,称为码长,单位为键。

一般的打字练习软件在计算时字数时,不仅包括汉字,还包括了标点符号,甚至包括了英文字母和数字等,这会造成字速的失真,因为非汉字字符常常只需要一键就能输入了,导致码长被非真实地缩短。

从字速的计算公式可以看出,打字速度取决于键速和码长两个因素。在码长一定的情况下,影响打字速度的决定性因素就是击键。在击键一定的情况下,决定打字速度的因素就是码长。然而,键速和码长都受很多因素的影响,情况相当复杂,将在接下来的两节详细论述。

然而,键速和码长都是统计平均值,是根据一定时间 t 内输入的总字数 c 和总用键数 n 计算出来的:

r = n ÷ t

l = n ÷ c

2 键速

在中文输入时的键速会受很多因素的影响,绝不是单纯的一个击键动作。花费更多时间的,往往是击键之前的一系列活动。看打时的预读和想打时的思考,字词的编码过程,提示选项的查看,这些常常会成为影响键速的关键因素。

编码方式和码元集大小也会影响键速。编码尽量采用易于击打的组合,码元集尽量小,都有利于加快击键,有利于提高打字速度,但却会增加码长,又同时会降低打字速度。偏面强调一方面都是不行的,如何平衡两者才是最关键的。

中文输入过程所花费的时间等于获取时间、编码时间、击打时间、选择时间、回改时间和处理时间之和。获取时间在看打时就是预读时间,在听打时则是听取时间,而在想打时就是思考时间。现代设备,不论是电脑还是手机,其处理时间都是非常短的,在人操作的同时进行的,一般可以忽略不计,只有在发生明显延迟的时候人才会感觉到。不同的人使用不同的输入法在不同的熟练程度时,花在不同操作上的时间是不同的。

对于最常见的拼音输入法来说,如果以句子为单位来输入,那么其获取时间和编码时间都短,击打时间因为码长较长是比较长的,选择时间因为不确定性而比较长,在发现输入和转换错误时的回改时间就很长了,总的时间花费有赖于转换的准确性,这是导致拼音整句输入速度不稳定和竞速成绩不理想的根本原因。如果以字词为单位来输入,那么其获取和编码时间都会增加,击打时间因为可以采用简拼而得到缩短,选择时间和回改时间因为观察的内容少而得到缩短,输入速度的稳定性也会增加。由于拼音的重码非常多,单字输入的效果非常差,所以基本上没有人会按这种方式来输入的,则有在改错时迫不得已才这么做。

对于五笔字型来说,如果以句子来输入,其效果是非常差的,完全是避其长而用其短,所以基本上都是以字词为单位来输入,而有的单字派则以字为单位来输入。如果以字词为单位,那么其获取时间和编码时间都比较长,击打时间因为码长较短而比较短,选择时间和回改时间因为重码较多和可能打空而较长。如果以字为单位来输入,那么其获取时间和编码时间都比较短,击打时间因为平均码长增加而加长,选择时间和回改时间因为重码少和没有打空问题而变短。

3 码长

码长分为理论码长和实际码长。理论码长是根据文字的统计特性直接计算出来的,与具体输入方案没有任何关系,但是可以做为一个最方便和最合理的比较基础和实现上的追求目标,可以说是非常重要的数据。而实际码长则与具体输入方案密切相关,是衡量其效率最重要的指标,当然前提是使用的码元集一样,否则就失去了比较的基础。如果要对码元集大小不同的输入方案进行比较,就需要先将它们转换为相同的码元集大小,通常是转换为二进制最方便,因为理论值通常就是以二进制的形式来呈现的。折算方法很简单,将码长乘以一个系数即可,这个系数是 log|K|,其中 | K | 为码元集的大小,log 是以 2 为底的。

3.1 理论码长

根据信息论,文字是一种平稳离散信源,因此文字的信息熵是可以计算出来的。这个熵实际上就是以二进制计算的文字中每个字符的平均码长,即理论码长。对于中文编码输入来说,中文的熵一般是以汉字的来近似的,因为非汉字字符一般用不着进行编码,而且汉字在中文中占居了绝大多数。故而,中文熵通常又称为汉字熵。

讨论中文输入涉及到几个重要的熵有零阶熵、字熵、词熵、句熵和极限熵。零阶熵和字熵都是以中文字符为单位来计算的,不考虑任何字符与字符之间的关系,其中零阶熵不考虑字频,而字熵是要考虑字频的。词熵、句熵和极限熵则分别以词、句和无限长的序列来计算。这些熵考虑的字符间关系的范围是不同的,依次增大,导致熵依次减小。

image.png

在上表中极限是指编码单元为无穷长的中文字符序列;零阶 1、零阶 2 和零阶 3 分别指以 GB2312-80 的 6763 字符、GBK 的 20902 字符和 GB18030-2022 的 87887 字符为准;2 码元、37 码元、36 码元、27 码元和 26 码元可分别看成是 2 进制、37 进制、27 进制和 26 进制。

image.png

极限熵和零阶熵的比值称为相对熵,而 1 减去相对熵就是冗余度。相对熵反映的是有效信息的比例,而冗余度反映的是可被压缩的程度,它的值就是 1 - 相对熵。

在上表中设中文的极限熵为 4.5;零阶 1、零阶 2 和零阶 3 分别指以 GB2312-80 的 6763 字符、GBK 的 20902 字符和 GB18030-2022 的 87887 字符为准;设英文的极限熵为 1.4 比特,而英文字母包括空格在内为 27 个。

3.2 实际码长

速度 s 的计算公式也可以直接来自统计结果:

s = c ÷ t

单个样本甚至短期内的实测结果都不一定是准确的,往往与目标总体之间存在或大或小的偏差。更有人有意无意地利用这种偏差来夸大或者贬低某个人或者某个输入方案的效果,采用极端情况下的演示效果来以偏概全,所以造成了众说纷纭甚至相互矛盾的乱象,让初学者无所适从,不知道谁说的正确。

从信息论的角度来讲,有三个重要的因素:应用场景(信源)、输入方案(编码)和输入设备(信道)。信源的冗余度决定了可被压缩的极限,而编码决定了实际的信源压缩程度,信道则代表用户操作设备(键盘)的能力,决定了传输效率。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,311评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,339评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,671评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,252评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,253评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,031评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,340评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,973评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,466评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,937评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,039评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,701评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,254评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,259评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,497评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,786评论 2 345

推荐阅读更多精彩内容