打字是计算机应用、软件应用中最基本、最普通不过的事。但越是平凡,就越难发现其中的道理,非要深思不可;思考得多了,才意识到,其中的道理远超出预料。这是一篇回归性的文章,不仅表现在从各色各样的软件回归到基本的输入法,也标志了善用佳软基本定型后的新一轮梳理。这一梳理将始于文字办公,经网络应用、图像影音,而止于系统工具。梳理完成后,善用佳软网站将进入“准静态”阶段。
只关注技术内容的读者,可只阅读第4部分。
1. 文字输入的赵氏三定律
之所以称为赵氏定律,是因为我有一位赵姓同学善于总结,提出了很多赵氏定律。现借其名,作为对他无双年代的纪念。
① 不相关定律:人的打字速度与输入法无关;人之成就,事之成效与打字速度无关。这是一个很不浪漫的定律,很无情的定律。要追求准确,可以修正“无关”为“无必然关系”,但“无关”更有警醒作用。此定律推而广之,可以说是,工作最好的人,并不是软件用得最好的人;软件用得最好的人,也并不是用“最好的软件的人”。也就是说,只有在明白目标、不妨碍目标的情况下,善用佳软才是有意义的。也就是说,执着中莫忘反思。
② 正相关定律:使用智能技术自动选词是应对重码的时兴方案,其准确率与语料库的大小成正比。
③ 负相关定律:有人用五笔打单字,有人用智能ABC不调词频可以记住重码时的位置。这种情况下,词库越小,重码率越低。
定律①说得是,打字/软件不见得多重要。定律② 和③ 要结合起来看,也就是说,为了相同的目标,可以有复杂和简单的不同解决办法,甚至表面上看起来完全相反。
本来按逻辑顺序,要再谈“文字输入三部件”的。但为了读起来不太枯燥,先说一下笔者使用输入法的非主流经历。
2. 善用佳软的输入法历程
计算机文化基础,“正式所学”的输入法为“阴阳码”,就是现在的二笔输入法。等到考试结束之后,才知道很多同学是打拼音完成了考试,因为拼音更快……那时并没有知名的拼音输入法,直到后来“中文之星”输入法的出现。但很长时间内,因为没有独立的计算机,所以,也没有固定的输入法,反正都是拼音。
写论文时,因为大量打字,所以开始研究一下输入法。开始用智能ABC加笔画减少重码,后来改为微软双拼,最好状态是闭着眼睛打很长一段话,然后再睁开眼睛修改几处即可。但那时的微软拼音有bug,经常导致死机,于是换到了智能ABC双拼。
此期间,热门的自然码、考拉输入法(就是紫光的前身)基本对我无影响。我一直交替用微软或智能ABC的双拼。
后来,遇到拼音之星输入法,因为它兼容多种双拼方案,再加上1MB的体积就可以智能语句,于是长期用它。详见《说说拼音之星吧》。
再后来,认为谭码的少重码和80多字的输入速度仍不能满足自己完全无重码的要求,于是开始了五笔!详见《学习五笔一周年之总结》,当然,最主要的原因是:再给自己一个挑战;学五笔一时的,用五笔是一世的。几款五笔输入法换了几款,后来,认识到了五笔爱好者论坛,才完整的认识到了五笔世界的多彩,并使用极点五笔至今,详见专文《……》。也就是说,善用佳软网站的文字,皆出自极点五笔86单字。
3. 文字输入的三个部件
其实,输入法并不是一个准确的称谓。很多用户评价某某输入法好坏时,可能包含了三方面内容:输入法程序、词库、编码方案。粗略一点说,这3 部分应该分别由计算机、语言、文字3 个学科的人员分别完成,才能做出最精致的产品。举例来说,王码的伟大在于“编码”,不仅提供了86/98的五笔编码方案,更投入了大量精力去推广。此后的一切五笔皆源于此。而作为输入法的王码五笔,比起现在的极点、海峰、加加则有很大缺陷。再如,sogou 和 google 输入法的成功在于程序支持网络词库(实际上仍然是下载到本地),再加上搜索引擎汇总出的超大词库。
换言之,如果三者相对独立,各有专攻,用户就会得到更好的使用体验。因为编码基本就是五笔、二笔、双拼、简拼、音形结合,并且主流是拼音和五笔,所以不多讨论。仅就词库和输入法设想一下:如果大家的词库都采取统一的开放格式,可以互换的话;则输入法开发者就可以抛开词库,真正拼程序,做出更好的输入法。用户也不会因为词库而被迫选择不喜欢的输入法。比如,你可以选择小巧的拼音加加,而使用搜狗的大词库。这才是一个美好的世界,一个符合应用、数据、格式(可以理解成输入法的皮肤)分离原则的世界。
没错,以xml为代表的应用、数据、格式分离是一个伟大的原则,必会完全改变将来的世界。在那样的环境下,善用佳软将不再需要关心选用 wordpress平台还是sina平台,也无须关注css样式,而是只须写文字(xml)。读者无论是到http://xbeta.info 阅读,还是通过rss 阅读,都可以选用阅读器提供的样式/版式,或第3方的样式/版式,或xbeta 默认的样式/版式。这既避免了提供者做不擅长的事,更为接收者提供了自由选择。我相信这样的原则。
4. 文字输入的一些经验
4.1 输入法的设置
- 删除你几乎不使用的输入法。比如我的计算机上只有极点五笔,和为偶用者保留的智能ABC。当然,要考虑到这些输入法可以输入GBK或更大的字符集。
- 不建议把中文输入法设为开机默认。对体积庞大、性能不稳定者更是强烈不建议。
- 如果有多种常用的输入法,则应设热键。设热键有技巧。①先要利用默认热键:除了第一常用放在 ctrl+space 的位置(即第一位)外,很多人不知道第二常用输入法可以放在最后一位,用ctrl+右shift 一键切入。这一点在与他人合用计算机时尤其有用,尊别人用ctrl+space,自用ctrl+右shift。②更多输入法,可以在输入法设置中分别指定 ctrl+shift+数字 这样的热键。有时,我也会在别人的计算机上,把ctrl+shift+5 指定为我习惯的五笔输入法。
4.2 输入法管理利器:IMETool
Silence出品的免费、小巧(50KB)、强大的软件。目前功能最全面的输入法设置工具,主要特色功能:
1、动态调整输入法顺序而无须重启。
2、突破 Windows 限制,任意设置输入法热键。
3、可以切换“高级文字服务”和“输入法指示器”两种工作模式。
4、可以修复常见的因注册表错误引起的输入法混乱问题。
5、可以从注册表中卸载输入法。
6、体积小巧,仅一个 50K 大小的文件,无须安装。
声明:IMETool 为免费软件,非商业使用无须授权,但不得对软件本身做任何修改。允许个人开发的免费输入法软件将其加入安装包使用,但安装包内不得包含有广告插件或流氓软件。
4.3 任何常用的字符串均应作为自定义词组
任何常用的字符串,都应定义为词组。比如
- 自己的标识及信息,包括全名、网名、id、Email、地址、电话号码、单位名称。
- 常用字符串:签名(某些输入法支持换行)、网址、当前日期、当前时间
- 专有名词:较长的软件名称(Total Commander)、大小写易出错的词或软件名称(7-Zip, Firefox)。
- 需要匹配的成对符号,比如《》“”。再进一步,极点五笔支持移动光标,即我输入zk后,会得到()并且光标位于括号内部。
- 特殊符号,比如——,√,★,①,②,:。比较特别的是,为了节省空间,我有时要在中文内使用半角冒号,因此,定义按下zm直接上屏:,而不用切换全半角。同理,按下zk会上屏两个全角空格,用于行首。
- 如果你手写html 源代码,则也可以把一长串源码定义为一个词组,如键入link得到
另外,文后“附1:xbeta在用/曾用的极点五笔用户词库”,可供参考和举一反三。
4.4 广义理解输入法
不要认为输入法就是IME (input method editor),就是按下ctrl+space切换的那个软件。广义的输入法就是从按键到屏幕显示之间的转换器。
基于广义理解,你可以用输入法来做更多的事:
- 很多输入法支持命令直通车,比如按下notepad,则启动记事本……
- 利用输入法也可以来填表单,把你常用信息存入词库即可。这样不仅更方便,也更准确。当然,注意安全。
- 利用输入法可以写代码。为什么不把常用的代码串加入词库呢?至少我在编写html 或写 blog时间经这样做过,简单多了。
- 输入法不仅可以输入中文。为什么不为常用的英文名词、中文中会遇到的半角符号、段首空2格、①②③这样的符号,也定义为一个词组呢。
- 输入法可以代替浏览器的网址缩写。没错,可以用输入法在地址栏键入xb,而上屏 http://xbeta.info
基于广义理解,更多程序都可以当作输入法来用:
- Vim 等高级工具的补全、缩写替换。实际上,只有在写blog 时用到的个别htm 代码我才定义在输入法中;其他在编辑html 时所用代码,笔者都是定义在 Vim中的。详见“附2:xbeta使用的 vimfilessyntaxhtml.vim”。
- 剪贴板增强工具(参见)的固定条目也可以帮助输入。
- 万能的AutoHotkey 之替换、热字符串功能也可以辅助输入。
- Office 的增强工具也可用为输入法。比如 MS Word的自动图文集、自动修正、固定词条……
5. 一些优秀的输入法
为了文章完整,有必要加入此段。但实际上,目前优秀输入法众多,且大多免费,比如拼音之google、sogou、紫光、加加、微软拼音……五笔之极点、海峰、加加、小鸭……所以,重复罗列实无必要。
说点其他的,尽管不实用,但有历史价值的:
- 每机必含而几乎很少有人会用(近几年又有不少新生用户)的郑码输入法,是《英华大词典》主编、著名文字学家郑易里先生的伟大成果,详见郑码网站。我无力评论它和五笔字型哪个更“合理”“科学”。但此为学者之作品,所以在专利、成果、与微软合作方面成功;王永民老师则既做研究,又做开发,还做大量推广,让五笔字型在“不规范”的帽子下仍能占据形码的绝对市场。
- 形码领域比拼音领域有更多的痴迷的开发者,尽管他们并无太大名气。
- 唯一能在五笔和拼音中,都属精品的是加加——拼音加加、五笔加加。这是精简、高效、易用的经典之作。因而能在开发者放弃之后,仍不断有后续公司和个人进行继续改善。而Easycode网友在无源码的情况下,利用超强汇编能力改进的五笔加加plus更是可贵。加加输入法的创造者是廖恒毅,入选了《程序员》评选的“影响中国软件开发的20人”,搜索“《程序员》专访:廖恒毅” 可得更多信息。从这次访谈中,你会明白,为什么开发者会放弃“行云流水般的输入感觉”的拼音加加;也会明白,为什么有些优秀国产软件却没有中文版,或者不再更新。
- 五笔爱好者论坛,
是学习五笔的好地方,更能结识优秀的开发者。人以群分,确实如此。五笔世界中发生过比拼音输入法领域更多的故事、闹剧,让我为某些人惋惜,也为其中凸现出来的人而更加高兴。而五笔爱好者论坛的气氛一直很好。用户会对有些软件/作者产生感情和超出技术的信任。比如,网友说Total Commander(原版或张学思版或shanny版)或极点五笔报病毒,我敢说,99.9% 的可能是非官方下载(被人改动)或杀软误报。也就是说,作者的品质、技术、责任心和软件质量一样重要,甚至决定了后者。杜志民语:已所不欲,勿施于人;己所欲,勿强施于人。
- 输入法早期有很多是共享软件。但后来,因为越来越优秀的免费软件的出现,共享转向了免费。尽管在此过程中,出现过一些恶意*的不良插曲。
只关注技术内容的读者,可只阅读第4部分。
1. 文字输入的赵氏三定律
之所以称为赵氏定律,是因为我有一位赵姓同学善于总结,提出了很多赵氏定律。现借其名,作为对他无双年代的纪念。
① 不相关定律:人的打字速度与输入法无关;人之成就,事之成效与打字速度无关。这是一个很不浪漫的定律,很无情的定律。要追求准确,可以修正“无关”为“无必然关系”,但“无关”更有警醒作用。此定律推而广之,可以说是,工作最好的人,并不是软件用得最好的人;软件用得最好的人,也并不是用“最好的软件的人”。也就是说,只有在明白目标、不妨碍目标的情况下,善用佳软才是有意义的。也就是说,执着中莫忘反思。
② 正相关定律:使用智能技术自动选词是应对重码的时兴方案,其准确率与语料库的大小成正比。
③ 负相关定律:有人用五笔打单字,有人用智能ABC不调词频可以记住重码时的位置。这种情况下,词库越小,重码率越低。
定律①说得是,打字/软件不见得多重要。定律② 和③ 要结合起来看,也就是说,为了相同的目标,可以有复杂和简单的不同解决办法,甚至表面上看起来完全相反。
本来按逻辑顺序,要再谈“文字输入三部件”的。但为了读起来不太枯燥,先说一下笔者使用输入法的非主流经历。
2. 善用佳软的输入法历程
计算机文化基础,“正式所学”的输入法为“阴阳码”,就是现在的二笔输入法。等到考试结束之后,才知道很多同学是打拼音完成了考试,因为拼音更快……那时并没有知名的拼音输入法,直到后来“中文之星”输入法的出现。但很长时间内,因为没有独立的计算机,所以,也没有固定的输入法,反正都是拼音。
写论文时,因为大量打字,所以开始研究一下输入法。开始用智能ABC加笔画减少重码,后来改为微软双拼,最好状态是闭着眼睛打很长一段话,然后再睁开眼睛修改几处即可。但那时的微软拼音有bug,经常导致死机,于是换到了智能ABC双拼。
此期间,热门的自然码、考拉输入法(就是紫光的前身)基本对我无影响。我一直交替用微软或智能ABC的双拼。
后来,遇到拼音之星输入法,因为它兼容多种双拼方案,再加上1MB的体积就可以智能语句,于是长期用它。详见《说说拼音之星吧》。
再后来,认为谭码的少重码和80多字的输入速度仍不能满足自己完全无重码的要求,于是开始了五笔!详见《学习五笔一周年之总结》,当然,最主要的原因是:再给自己一个挑战;学五笔一时的,用五笔是一世的。几款五笔输入法换了几款,后来,认识到了五笔爱好者论坛,才完整的认识到了五笔世界的多彩,并使用极点五笔至今,详见专文《……》。也就是说,善用佳软网站的文字,皆出自极点五笔86单字。
3. 文字输入的三个部件
其实,输入法并不是一个准确的称谓。很多用户评价某某输入法好坏时,可能包含了三方面内容:输入法程序、词库、编码方案。粗略一点说,这3 部分应该分别由计算机、语言、文字3 个学科的人员分别完成,才能做出最精致的产品。举例来说,王码的伟大在于“编码”,不仅提供了86/98的五笔编码方案,更投入了大量精力去推广。此后的一切五笔皆源于此。而作为输入法的王码五笔,比起现在的极点、海峰、加加则有很大缺陷。再如,sogou 和 google 输入法的成功在于程序支持网络词库(实际上仍然是下载到本地),再加上搜索引擎汇总出的超大词库。
换言之,如果三者相对独立,各有专攻,用户就会得到更好的使用体验。因为编码基本就是五笔、二笔、双拼、简拼、音形结合,并且主流是拼音和五笔,所以不多讨论。仅就词库和输入法设想一下:如果大家的词库都采取统一的开放格式,可以互换的话;则输入法开发者就可以抛开词库,真正拼程序,做出更好的输入法。用户也不会因为词库而被迫选择不喜欢的输入法。比如,你可以选择小巧的拼音加加,而使用搜狗的大词库。这才是一个美好的世界,一个符合应用、数据、格式(可以理解成输入法的皮肤)分离原则的世界。
没错,以xml为代表的应用、数据、格式分离是一个伟大的原则,必会完全改变将来的世界。在那样的环境下,善用佳软将不再需要关心选用 wordpress平台还是sina平台,也无须关注css样式,而是只须写文字(xml)。读者无论是到http://xbeta.info 阅读,还是通过rss 阅读,都可以选用阅读器提供的样式/版式,或第3方的样式/版式,或xbeta 默认的样式/版式。这既避免了提供者做不擅长的事,更为接收者提供了自由选择。我相信这样的原则。
4. 文字输入的一些经验
4.1 输入法的设置
- 删除你几乎不使用的输入法。比如我的计算机上只有极点五笔,和为偶用者保留的智能ABC。当然,要考虑到这些输入法可以输入GBK或更大的字符集。
- 不建议把中文输入法设为开机默认。对体积庞大、性能不稳定者更是强烈不建议。
- 如果有多种常用的输入法,则应设热键。设热键有技巧。①先要利用默认热键:除了第一常用放在 ctrl+space 的位置(即第一位)外,很多人不知道第二常用输入法可以放在最后一位,用ctrl+右shift 一键切入。这一点在与他人合用计算机时尤其有用,尊别人用ctrl+space,自用ctrl+右shift。②更多输入法,可以在输入法设置中分别指定 ctrl+shift+数字 这样的热键。有时,我也会在别人的计算机上,把ctrl+shift+5 指定为我习惯的五笔输入法。
4.2 输入法管理利器:IMETool
Silence出品的免费、小巧(50KB)、强大的软件。目前功能最全面的输入法设置工具,主要特色功能:
1、动态调整输入法顺序而无须重启。
2、突破 Windows 限制,任意设置输入法热键。
3、可以切换“高级文字服务”和“输入法指示器”两种工作模式。
4、可以修复常见的因注册表错误引起的输入法混乱问题。
5、可以从注册表中卸载输入法。
6、体积小巧,仅一个 50K 大小的文件,无须安装。
声明:IMETool 为免费软件,非商业使用无须授权,但不得对软件本身做任何修改。允许个人开发的免费输入法软件将其加入安装包使用,但安装包内不得包含有广告插件或流氓软件。
4.3 任何常用的字符串均应作为自定义词组
任何常用的字符串,都应定义为词组。比如
- 自己的标识及信息,包括全名、网名、id、Email、地址、电话号码、单位名称。
- 常用字符串:签名(某些输入法支持换行)、网址、当前日期、当前时间
- 专有名词:较长的软件名称(Total Commander)、大小写易出错的词或软件名称(7-Zip, Firefox)。
- 需要匹配的成对符号,比如《》“”。再进一步,极点五笔支持移动光标,即我输入zk后,会得到()并且光标位于括号内部。
- 特殊符号,比如——,√,★,①,②,:。比较特别的是,为了节省空间,我有时要在中文内使用半角冒号,因此,定义按下zm直接上屏:,而不用切换全半角。同理,按下zk会上屏两个全角空格,用于行首。
- 如果你手写html 源代码,则也可以把一长串源码定义为一个词组,如键入link得到
另外,文后“附1:xbeta在用/曾用的极点五笔用户词库”,可供参考和举一反三。
4.4 广义理解输入法
不要认为输入法就是IME (input method editor),就是按下ctrl+space切换的那个软件。广义的输入法就是从按键到屏幕显示之间的转换器。
基于广义理解,你可以用输入法来做更多的事:
- 很多输入法支持命令直通车,比如按下notepad,则启动记事本……
- 利用输入法也可以来填表单,把你常用信息存入词库即可。这样不仅更方便,也更准确。当然,注意安全。
- 利用输入法可以写代码。为什么不把常用的代码串加入词库呢?至少我在编写html 或写 blog时间经这样做过,简单多了。
- 输入法不仅可以输入中文。为什么不为常用的英文名词、中文中会遇到的半角符号、段首空2格、①②③这样的符号,也定义为一个词组呢。
- 输入法可以代替浏览器的网址缩写。没错,可以用输入法在地址栏键入xb,而上屏 http://xbeta.info
基于广义理解,更多程序都可以当作输入法来用:
- Vim 等高级工具的补全、缩写替换。实际上,只有在写blog 时用到的个别htm 代码我才定义在输入法中;其他在编辑html 时所用代码,笔者都是定义在 Vim中的。详见“附2:xbeta使用的 vimfilessyntaxhtml.vim”。
- 剪贴板增强工具(参见)的固定条目也可以帮助输入。
- 万能的AutoHotkey 之替换、热字符串功能也可以辅助输入。
- Office 的增强工具也可用为输入法。比如 MS Word的自动图文集、自动修正、固定词条……
5. 一些优秀的输入法
为了文章完整,有必要加入此段。但实际上,目前优秀输入法众多,且大多免费,比如拼音之google、sogou、紫光、加加、微软拼音……五笔之极点、海峰、加加、小鸭……所以,重复罗列实无必要。
说点其他的,尽管不实用,但有历史价值的:
- 每机必含而几乎很少有人会用(近几年又有不少新生用户)的郑码输入法,是《英华大词典》主编、著名文字学家郑易里先生的伟大成果,详见郑码网站。我无力评论它和五笔字型哪个更“合理”“科学”。但此为学者之作品,所以在专利、成果、与微软合作方面成功;王永民老师则既做研究,又做开发,还做大量推广,让五笔字型在“不规范”的帽子下仍能占据形码的绝对市场。
- 形码领域比拼音领域有更多的痴迷的开发者,尽管他们并无太大名气。
- 唯一能在五笔和拼音中,都属精品的是加加——拼音加加、五笔加加。这是精简、高效、易用的经典之作。因而能在开发者放弃之后,仍不断有后续公司和个人进行继续改善。而Easycode网友在无源码的情况下,利用超强汇编能力改进的五笔加加plus更是可贵。加加输入法的创造者是廖恒毅,入选了《程序员》评选的“影响中国软件开发的20人”,搜索“《程序员》专访:廖恒毅” 可得更多信息。从这次访谈中,你会明白,为什么开发者会放弃“行云流水般的输入感觉”的拼音加加;也会明白,为什么有些优秀国产软件却没有中文版,或者不再更新。
- 五笔爱好者论坛,
是学习五笔的好地方,更能结识优秀的开发者。人以群分,确实如此。五笔世界中发生过比拼音输入法领域更多的故事、闹剧,让我为某些人惋惜,也为其中凸现出来的人而更加高兴。而五笔爱好者论坛的气氛一直很好。用户会对有些软件/作者产生感情和超出技术的信任。比如,网友说Total Commander(原版或张学思版或shanny版)或极点五笔报病毒,我敢说,99.9% 的可能是非官方下载(被人改动)或杀软误报。也就是说,作者的品质、技术、责任心和软件质量一样重要,甚至决定了后者。杜志民语:已所不欲,勿施于人;己所欲,勿强施于人。
- 输入法早期有很多是共享软件。但后来,因为越来越优秀的免费软件的出现,共享转向了免费。尽管在此过程中,出现过一些恶意*的不良插曲。