読者です 読者をやめる 読者になる 読者になる

「開発の主体」って何だろう?

某MS社員に、「MS IME最近どうなっているのよ?」と先週聞いた答えが...「IME開発の主体が、中国にシフトしまっていて我々も手を出せない......個人的にはATOKに切り替えようと思っている」と言う現役開発系社員の発言に絶句!!!

4 兆円を超える金でYahoo買おうという発想があるならその数10分の1でも、IMEの品質向上に自ら開発投資をするべきで...本来IMEは、かな漢字変換としての機能だけではなく...正しい漢字を検索する、自分のファイルやデータをローカルファイルの中から検索する、企業内部で共通辞書や住所、顧客データなどを検索する、社会のデータベースやインターネット上の情報を検索するに必要な共通技術であるにも関わらず...まぁ、そんなことが理解できない経営者が...IMEの開発は中国でやった方が安く済むと思っているのであれば、未来は無いねぇ...

私自身はずっと ATOK を使っていて,最近リリースされた ATOK 2008 も既に導入済みです.一方 MS-IME の中の人とも時々お話しする機会があって,MS-IME 2007 についても色々意見交換をしたことがあるのですが,なんかどうも古川さんのブログに書かれている話と自分の認識が違う気がします.



確かに,MS-IME 2007 では,変換エンジンの大規模な刷新が行われていて,その件に中国の Microsoft Research が関係しているという話は聞いています.以下のインタビュー記事にあるように,音声認識などで研究されていた統計的言語処理の仕組みを,日本語変換エンジンに応用する過程でのことだそうです.

■変換アルゴリズムの一新は、かな漢字変換処理の根幹にかかわる大変化。なぜ、これほどの変更に踏み切ったのか。

変換精度の向上が鈍ってきたからだ。従来の方法での精度向上は飽和しつつある。もっとほかにできることがあるのではと考え、変えようという決断に至った。

従来は、品詞と品詞の接続のしやすさを記述した「品詞接続表」を利用して変換結果を決定していた。大ざっぱな表は統計的に作れるが、最後は職人技とも言える手作業での調整作業に頼るほかない。このため保守が大変で、もっと科学的で機械的な手法を求めていた。

こうした背景にマッチしていたのがTrigram/SLMだった。元々は音声認識分野で使われてきた技術だ。我々は米国や中国のマイクロソフト・リサーチ(マイクロソフトの研究開発部門)とも議論したが、彼らも同じ技術に着目していた。2001年から一緒にプロジェクトを進め、1年で、これでいけるというめどが立った。

Microsoft Research は,米国本社にある Microsoft Research Redmond,イギリスのケンブリッジにある Microsoft Research Cambridge,中国の北京にある Microsoft Research Asia の 3 ヶ所など,計 6 ヶ所があります.上のインタビューでは,MS-IME 2007 の変換エンジンに使用されている基礎研究が Microsoft Research Redmond と Microsoft Research Asia の成果であると明言されています.
一方,古川さんの記事からは,MS-IME 2007 の開発の大半が中国で行われているという印象を受けます.これが Microsoft Research Asia のことだとすれば,研究部門である Microsoft Research で製品開発が行われているというのも不思議な話です*1.それとも中国には別の製品開発部門があって,そこで MS-IME 2007 が開発されているということなのでしょうか?
はてブコメント を見る限り,古川さんの記事を読んだ多くの方は MS-IME 2007 はかなりの部分がオフショア開発されていると理解されたようですが,私の認識は違って,統計処理アルゴリズムの基盤部分が中国の Microsoft Research で研究開発されていて,残りは国内で開発されているものという認識でした.まあまた機会があれば中の人に聞いてみようかと思います.

追記

やはり中国の製品開発部門との分担作業ということらしいですね.

中国にシフトしてという意味は、外部の協力会社に発注しているということではなく、中国の開発部門が作業の分担と責任を持っているということです。本件は、研究部門(Research)とは関係の無い話です。ポイントは、米国のResearch部門にも日本語言語解析の専門家が研究員で努めており、日本語の変換効率を高めるための開発努力をしてきた人間もたくさんいて、なおかつ操作性(ユーザビリティ)の向上やテスティング手順、お客様からのフィードバックが全て機能してMS IMEは使い物になる状態になってきたのではないか? それなのに、使い勝手も変換結果も後退しているように見えるのは何故?ということです。

*1:Microsoft Research Asia は Google と人材獲得合戦をやっているはずで,決して「安い」ということはないはずです.Microsoft Research Asia の人材を投入して製品開発を行うぐらいなら,国内で開発した方が安いということも十分あり得るんじゃないでしょうか.