由於漢字有數以萬計,電腦鍵盤不可能為每壹個漢字而造壹個按鍵。因此,人們需要替漢字編碼(檢索出漢字的代碼),用數個鍵來輸入壹個漢字。中文輸入法的發展過 程,是“萬碼奔騰”的過程,在30年間出現了上千種編碼方法。
最早的漢字輸入法,壹般認為是從70年代末期或者80年代初期有了個人電腦PC開始誕生的,雖然更早有電報碼,用0──9十個數字中的四位組合構成每壹個漢字,便於郵電局發送電報之用,但通常意義上,人們還是認為從1981年國家標準局發布《信息交換用漢字編碼字符集基本集》GB2312-80以來,個人計算機上開始使用五筆或者拼音輸入漢字才是輸入法廣為使用的真正開始。在臺灣的漢字輸入法歷史則可追溯至1976年由朱邦復發明之倉頡輸入法開始。
漢字輸入法的發展,壹方面是輸入法軟件的功能的改進和完善,另壹方面是新型輸入法編碼的不斷湧現。前者主要是針對拼音輸入法,後者則出現了“萬碼奔騰”的局面。早期的輸入法軟件大都為收費軟件,很多企業或個人依靠銷售輸入法軟件掙錢,如今收費的輸入法已經很少,絕大多數輸入法軟件都是免費的產品。 拼音類的輸入法包括大陸的拼音輸入法和臺灣的註音輸入法等。拼音輸入法相比其他輸入法有著天然的優勢,因為現代每壹個接受教育的中國人在還沒學習漢字前就先用大量時間學習漢語拼音或註音符號,原本只是用來標記漢字讀音的拼音也就可以輕松地作為漢字的輸入編碼。拼音輸入法另壹個優勢就是接近口語話,所以拼音輸入法可以在極短時間內適應。
但是拼音輸入法有著致命的弱點,就是漢字輸入法編碼時,單字重碼率異常高,即使詞組重碼率也是非常高。為了讓拼音能夠較快速的錄入漢字,只有借助復雜的輸入法軟件來提高拼音輸入能力,比如支持智能排序,以詞定字,整句輸入,雲輸入功能等,縱觀拼音輸入法的發展,也即拼音輸入法軟件的發展。
在中文輸入法誕生之初就最先出現拼音輸入法,但是當時的拼音輸入法軟件功能差,字序固定,不支持詞組和整句輸入,甚至文字不能和編碼壹起顯示。在輸入漢字過程中常常要翻很多頁才能找到需要的漢字,輸入效率非常低下。雖然當時很多人都只會用拼音輸入法,但大部分人都不滿拼音輸入法的輸入效率。
20世紀90年代後,拼音輸入法軟件開始支持詞組輸入和整句輸入。1993年出來的中文之星輸入法軟件能夠做到單個字詞的即時顯示,即壹邊打拼音,同時顯示漢字。中文之星軟件進行壹些巧妙設計,如空格確認、逗號句號選重碼、允許模糊音容錯和自定義字符串等,這些功能已經成為當今所有拼音輸入法軟件的必備功能。1993年初北京大學的朱守濤先生發明發明了智能ABC輸入法,後被微軟收購內置到Windows系統中。在隨後幾年中智能ABC輸入法成為了中國大陸使用人數最多的輸入法軟件。
1994年的出來的自通輸入法軟件和1996年的黑馬神拼輸入法軟件,這兩種輸入法都實現了漢字整句輸入(又稱語句輸入)能力。漢字整句輸入可追溯到20世紀80年代末期,哈爾濱工業大學在校博士生王曉龍進行了漢字分詞方面研究,並申請了863課題,寫出了“最小分詞問題及其解法”方面的論文,從而奠定了拼音整句的輸入的理論基礎。微軟從Windows 95中文版開始,在系統內置支持整句輸入功能的“微軟拼音輸入法”。
然而當時的拼音輸入法普遍智能化程度不高,整句輸入不成熟,輸入過程中錯誤率高,而且不能夠與所敲拼音同步顯示漢字(微軟拼音是滯後壹個字、自通是滯後幾個字、黑馬拼音是需要最後確認才出現漢字),整句輸入過程中修改拼音選擇漢字不方便,大大限制了整句拼音輸入法的使用,所以很多用戶還在繼續智能ABC。直到1998年譚亞軍發明的拼音之星軟件,才完全支持“實時顯示”的方式,不管輸入多少拼音,每個字母按下去,漢字就同時顯示,拼音有錯誤,用戶就會立即發現,又由於支持自動分詞與整句輸入,用戶不用去擔心是輸入壹個詞語還是壹句話,系統都能夠進行處理,如果沒有該詞語,系統也能夠自動學習並存盤,似乎具有了詞語輸入法的方便性與整句輸入法的智能性。到了1999年出現了另外幾個拼音輸入法軟件:拼音加加、自由拼音輸入法和考拉輸入法,拼音加加軟件開始支持在不切換輸入法情況下直接用Enter直接鍵入英文字母
在90年代,雙拼輸入法和相應的輸入法軟件也得到了快速發展。雙拼輸入法誕生了多種方案,如自然碼輸入法軟件提供的自然碼方案,更采用雙拼加偏旁或筆劃的音形結合方式編碼,提供了壹種快速輸入漢字的途經,這已經超出了拼音輸入法的範疇,嚴格來說自然碼雙拼不屬於純拼音,而是壹種音形碼。此外微軟、拼音之星、拼音加加、小鶴雙拼等都提供了各自不同的雙拼方案。
進入新世紀後,拼音輸入法軟件功能趨於成熟,正式進入了智能拼音輸入法時代,這時產生的拼音輸入法軟件主要是整合以前拼音輸入法軟件優點,提供了更大的詞庫,軟件的智能性也更強,還擁有了更強的學習能力。
2000年初出來的智能狂拼也提供了更智能的輸入方式。而紫光拼音輸入法是在考拉輸入法的基礎上開發而成,提供了壹個更大的詞庫,增加了智能組詞,也就是說用戶連續輸入9個字以內的拼音串,系統能夠自動轉換成漢字,而不論是否有這個詞語,系統根據詞頻高頻先見的方式給出壹個詞語串的組合。紫光輸入法最終成了用戶最喜歡的輸入法之壹。
隨著互聯網的快速發展,2006年6月由搜狐公司推出的壹款Windows平臺下的搜狗拼音輸入法。搜狗拼音輸入法是基於搜索引擎技術的新壹代的拼音輸入法產品,用戶可以通過互聯網備份自己的個性化詞庫和配置信息。搜狗拼音輸入法壹經出來很快取代了智能ABC輸入法而成為中國現今主流漢字輸入法。
在搜狗輸入法出來後,谷歌、騰訊、百度和微軟也相繼推出了同壹類型的智能拼音輸入法:谷歌拼音輸入法、QQ拼音輸入法、百度輸入法、必應輸入法。
隨著智能手機和平板電腦的流行,很多IT企業又開發了Android、iPhone、iPad的拼音輸入法,如百度手機輸入法、QQ手機輸入法、搜狗手機輸入法等。這些輸入法延續了電腦上輸入法的特點,同時輸入法軟件針對觸屏的特點,從而提供了更為靈活的輸入方式。
在臺灣的拼音輸入法則以註音輸入法為主,與大陸類似都是在輸入法軟件方面不斷得到完善和改進,變得更加智能。與大陸不同的是,大陸拼音輸入法壹致采用英文26鍵作為拼音輸入法的鍵位,而臺灣使用的註音輸入法鍵位設置沒有壹個統壹的標準,從40鍵到30鍵,再到26鍵都有人使用。因為註音符號與鍵盤的英文字母並不是壹壹對應的,所以註音符號設置鍵位的時候往往采用數字鍵和符號鍵作為編碼。
在香港人則流行粵語拼音輸入法(又名廣東話輸入法),利用漢字的粵語讀音,在電腦上輸入漢字。由於粵語拼音缺乏統壹的拼音標準辦法,各種軟件的拼音法並不壹致,故有礙粵語拼音輸入法進壹步的發展和普及。 雖然拼音輸入法簡單易學,但是漢字同音字現象之多所導致的重碼率居高不下,即使輸入詞組重碼也是相當高,縱然加上雲輸入功能也無法完全做到精確地輸入文字,所以在拼音編碼外就湧現了大量的編碼方案,主要有形碼和音形碼兩類,這些編碼往往比拼音輸入法具有更低的重碼率,熟練後可以很快地輸入漢字。中國大陸最早出現並流行開來的形碼輸入法是由王永民於1983年發明的五筆字型輸入法。在臺灣最早的形碼輸入法則是1976年由朱邦復發明之倉頡輸入法。
電腦在中國普及,第壹個急需要解決的問題就是,如何將漢字輸入到電腦中,拼音雖然可以作為漢字的編碼,制作成拼音輸入法,但是很長壹段時間拼音輸入法的輸入漢字效率極其低下。為了能夠讓中文快速的在電腦上輸入,有的人拋棄英文鍵盤布局而另外設計了專門的中文鍵盤,這些鍵盤作為編碼的鍵數量有的為幾十個,甚至有的達到幾百個,但是這些方案並沒有實現中文的輕松或快速錄入。
直到 1983年8月,王永民推出了劃時代的五筆字型輸入法。五筆輸入法采用普通的電腦鍵盤,只使用英文字母鍵其中的25個參與編碼,不但可以讓我們輸入漢字,而且也極大的解決了輸入速度這壹頑癥。五筆字型完全依據筆畫和字形特征對漢字進行編碼,是典型的“形碼”。五筆字型在發展過程中先後誕生了三種編碼方案,即86版和98版和新世紀版。作為國內第壹個推廣的形碼輸入法,壹經推出來,即受到很多用戶的熱捧,在80年代和90年代,很多人學習電腦的第壹要務就是學習五筆字型輸入法,五筆的教學培訓班也遍地開花。
在80年後期還出現了另壹個著名的形碼輸入法——鄭碼輸入法。鄭碼是鄭易裏和女兒鄭瓏***同發明的壹種中文輸入法,鄭碼相比於五筆更加規範,而且鄭碼輸入法要比五筆更加廣泛,因為微軟從Windows 95系統開始就內置鄭碼輸入法,成為系統默認自帶的輸入法,直到2012年的Windows 8才取消內置鄭碼輸入法。鄭碼推出後很快獲得中、美、英國專利授權,並通過國家級的鑒定,曾榮獲北京國際發明金獎和最優秀發明大獎;榮獲第22屆日內瓦發明金獎。為了解決繁體字與簡體字通用的問題,鄭碼采用字根雙編碼方式減少字根重碼,因采用按特征檢索基根和區碼方式以及大多采用標準的偏旁部首記憶量增加不大較為易學。
在80年代和90年代,由於國家教委尚未有推薦輸入法方案,所以在中小學裏教的漢字輸入法相當多,各個學校教漢字輸入法也不盡相同,有的教五筆字型,有的教自然碼,有的教肖碼等。雖然五筆字型輸入法可以快速錄入漢字,也在全國範圍內得到較為廣泛的商業推廣,但是五筆因為學習難度高,而且五筆編碼本身有不少存在不合理的地方,比如字根不符合漢字基本部件與違反筆順的問題,所以壹直無法成為國家教委的推薦輸入法。
進入90年代後,國家教育委員會批準了關於研發輸入法的“八五”重點攻關項目。在1992年8月1日至3日,國家教委基礎教育司及直屬的全國中小學計算機教育研究中心在北京召開了 “全國中小學教學漢字編碼規範與計算機漢字輸入系統”的研討會。最後與會代表認為,在目前的中小學計算機教學中,應主要使用漢語拼音方案作為計算機漢字輸入方法,而對形碼的選擇應持特別慎重態度,目的在於避免對語言文字的“汙染”,並堅決反對用商業競爭或行政命令手段在中小學中強制推行不規範的漢字輸入編碼方案的做法。兩年後項目課題組推出了名叫“認知碼計算機漢字輸入系統”的形碼輸入法, 1995年國家教委推薦中小學使用認知碼,向全國中小學校全面推廣。
可是,由於認知碼自身存在很多欠缺,在推行之中遇到很大爭議和阻力。不少學術刊物紛紛載文討論認知碼,因為認知碼自身的致命缺陷,比如重碼率相當高、編碼規則復雜、易學性差、字根選擇缺乏正確的規範、簡碼的使用不科學,使這種後來研制出的官方編碼被批評家批駁得體無完膚,壹蹶不振。最後認知碼全面推廣之事也不了了之。
在國家教委想方設法研發壹種易學規範而又快速的輸入法同時,壹種更優秀的輸入法——二筆輸入法已經在民間誕生。二筆輸入法是陳勁松於1992年發明的音形碼輸入法,采用拼音首字母與筆畫(兩個筆畫取壹鍵)相結合的方式取碼。二筆輸入法直到2000年1月成立的廣東二筆軟件有限公司向外界推出二筆輸入法軟件後,才正式出現在大眾的視野中。二筆輸入法不但易學,還可以輸入文字打出像五筆壹樣速度。二筆輸入法具有規範、易學、快速的特點,因此順利通過國家教育部基礎教育課程教材發展中心評審而獲準進入中小學基礎教材,這是截止2013年唯壹獲得批準進入中小學基礎教材的漢字輸入法。
由於廣東二筆軟件有限公司以高價銷售二筆輸入法軟件,而且當時(2000年到2004年期間)已經得到廣泛使用的智能ABC輸入法和五筆輸入法是免費的產品,只有很少人願意嘗試使用二筆。最終導致以經營二筆輸入法軟件為主要業務的廣東二筆軟件有限公司在2004年瀕臨倒閉。在另壹方面,二筆輸入法以其優秀的特性吸引了不少二筆愛好者,還有些愛好者對二筆進壹步改進和優化,同時對二筆輸入法軟件進行維護。二筆輸入法軟件大都能夠在互聯網上免費獲得和使用。
而隨著智能拼音輸入法時代的到來,特別是在2006年搜狗拼音輸入法的誕生後,非拼音類的形碼或音形碼輸入法受到的關註也就越來越少,而且不再有國家相關部門參與開發和推廣輸入法。但這並不影響眾多輸入法愛好者對輸入法編碼方案研究的熱情。很多愛好者研究輸入法都會從多面方面考慮,比如重碼率、易學性、對大字庫的支持、輸入法按鍵的舒適程度等。
壹些輸入法愛好者仍然想得到壹個超低重碼率的輸入法,所以也就產生了GB2312-80字符集的6763個漢字中只有14個重碼字的張碼輸入法。在支持大字庫方面,除了輸入法編碼本身外,更要輸入法軟件和字庫或詞庫的支持,所以誕生了收錄全部七萬多個UNICODE漢字的海峰五筆軟件。而在輸入法編碼方案易學方面,至今依然沒有壹個能夠超越二筆輸入法的編碼方法,能夠做到既高效又易學。
在臺灣,中文輸入法也出現了非常多的輸入法編碼方案。1976年朱邦復發明第壹個形碼輸入法——倉頡輸入法,發明輸入法後,朱邦復公開該輸入法,不收分文,使電腦漢化得到很大的進展。所以臺灣的Windows操作系統都內置有倉頡輸入法。也成為臺灣最流行的形碼輸入法之壹。成倉頡輸入法出來之後又誕生了壹批形碼輸入法,像王贊傑發明了大易輸入法,廖明德發明了行列輸入法,和倉頡輸入法壹樣,這些輸入法作者開放輸入法專利,所以同樣內置到了Windows系統中。在臺灣使用人數最多的形碼輸入法是嘸蝦米輸入法,這是在20世紀80年代後期,臺灣人劉重次發明的壹種形碼輸入法。 通常我們所說的輸入法都指電腦普通鍵盤或手機鍵盤上的輸入法,包括拼音、形碼和音形碼。除了這些通常意義的輸入法外,還有語音輸入、手寫輸入,以及速錄技術等,這類輸入法技術的發展既與普通鍵盤輸入法發展息息相關,又獨立於普通鍵盤輸入技術。
漢字語音輸入是利用語音識別技術將語音轉換為文字的輸入方法,通常是采用馬爾可夫信息模型進行統計處理和基於規則方法進行歧義判別。20世紀90年代中後期,IBM終於推出非特定人連續語音識別系統ViaVoice,這是當時語音識別中的佼佼者。與此同時國內很多從事漢字語音識別研究的人員運用在研究所或大學學到的知識或研究成果,建立了巨大的中文語言資料庫(又叫語料庫),推出了中文普通話的語音輸入系統。科大訊飛現已成為中國最大的智能語言技術提供商。在個人電腦上要實現語音輸入中文往往還需要外接設備。而今隨著智能手機的普及,很多智能手機的輸入法都自帶語音輸入功能,如百度手機輸入法、訊飛語音輸入法等都具有語音輸入的方法,用戶也可以方便地利用手機進行語音輸入文字。但是,語音輸入有還不能提高非常精確的文字輸入。
除了語音輸入文字外,手寫也是壹種常見的輸入漢字方法。手寫輸入法是在手寫板或觸屏手機屏幕直接書寫的中文輸入方式。1997年就已經出現了基本可以使用的手寫漢字輸入系統,采用了基於語義句法的模式識別方法。20世紀90年代也誕生了不少手寫產品,比如中自公司的“漢王99”和摩托羅拉公司的“慧筆”。但是在隨後幾年裏手寫並沒有得到廣泛使用,直到觸屏手機的出現,特別是在智能手機和平板流行後,手寫輸入法才得到更加廣泛使用。
速錄技術嚴格來說並不屬於輸入法編碼方法,速錄所用到的編碼方法實際上也就主要為三種:拼音、形碼和音形碼。速錄壹般面向特定的領域,速錄師就業面向政府機關、司法系統。這些領域對於文字的錄入速度要求比較高,特別是在會議,速錄師可以邊聽邊將文字打出來,就像文字立即出現在眼前。另外速錄的鍵盤通常也不同於普通鍵盤,而采用速錄鍵盤,如亞偉速錄采用國際通用的速錄鍵盤。
亞偉速錄是最早的壹種中文速錄技術,采用拼音輸入方式,由唐亞偉於1993年發明。亞偉速錄也是如今最廣泛的中文速錄技術。在亞偉速錄之後又出現了其他多種速錄技術,如國育速錄、超音速錄、飛耀速錄、五筆雙打等。
雖然速錄使用的編碼方案通常為拼音方案(也有少數采用五筆或二筆方案),經過特殊的編碼組合,但是大多數都采用並擊技術,並擊需要每次多個手指分別按下多個不同的鍵,可以有效地提高擊鍵效率,從而也就突破了普通鍵盤每分鐘200到300字的極限速度,而達到每分鐘600字以上的速度。