Yosemiteの日本語入力はことえりではなくMeCabベースの日本語IMだった

2014/11/03

kotoeri

Macの日本語入力プログラムについて好き勝手なことを書いてみたら、Mac OS X Yosemite の日本語入力プログラムは、漢字Talk 7 の時代から親しまれてきた「ことえり」ではなく、形状素解析アルゴリズム MeCab をベースにした新規の「日本語IM」であると教えていただきました。

基調な情報をいただきまして、どうもありがとうございます。

形状素解析エンジンMeCabとは?

公式サイト

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです。 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています。 パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSen, Juman, KAKASIより高速に動作します。 ちなみに和布蕪(めかぶ)は, 作者の好物です。

Wikipedia

MeCabはオープンソースの形態素解析エンジンで、奈良先端科学技術大学院大学出身、現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓[1][2]によって開発されている。名称は開発者の好物「和布蕪(めかぶ)」から取られた。

Mac では Spotlight の入力、iPhone の日本語入力などに使われてきたものらしいですね。Spotlightで高速かつ効率的に入力できていたので、あえて「ことえり」と別に搭載する意味はないという判断なのでしょうか。

Google 日本語入力とよく似たアルゴリズムということは、ほぼ同等の性能になったと考えても良いということ?

実際、Yosemite の日本語IMを使っていると、リアルタイム変換候補が便利なことも相まってなかなか快適に入力することができると思います。

さようなら、ことえり

「ことえり」を漢字で書くと「言選り」。風情があっていい名前だと思うのですが、これがなくなって「日本語IM」という味気ない名前になってしまうのは寂しい限り。Appleから公式には何も説明がないまま、ことえりが消えてしまうというも悲しいですね。

しかし、使い勝手の一点だけじゃなく、変換効率についてもサードパーティ製の日本語入力プログラムに比肩するようになったとすると、じっくりとユーザー辞書を鍛えながら使い込んでいく覚悟を決めるのもいいかもですね。

何より、OSとの相性問題が発生しないだろうという安心感は大きいです。そして使っていて感じるのは、とても高速に動作していて、使い心地が良いということ。標準搭載の日本語入力プログラムが、Google 日本語入力プログラムと内部的には同等になったというのは歓迎したいと思います。搭載される辞書に違いはありますので、完全に同等とはならないと思いますが、それでもことえり時代よりも標準の辞書自体が強化されたように思います。

関連記事