MS-IME 2007, 何故か壊れる,Google の「大規模日本語 n-gram データ」

MS-IME 2007

古川さんのブログ発でまた MS-IME 2007 の誤変換ネタが盛り上がってますが,先日 MS-IME の中の人とお食事しながら,変換アルゴリズム等について色々話を伺ってきました.といってもここに書けるような話はあんまりないんですが.

何故か壊れる

データファイル/辞書ファイルはなぜか壊れる.
と田畑さんも言っている.(ここPPT ファイル 17 ページ目 に GO!)

Google の「大規模日本語 n-gram データ」

Google Japan Blog: 大規模日本語 n-gram データの公開
おおっ,と思ってみてみたら 商用利用不可 だった.