トップ «前の日記(2006-12-12) 最新 次の日記(2006-12-14)» 編集

日々の破片

著作一覧

2006-12-13

_ IME2007

止まるよ止まる動きが止まる……(でもやっと覚えてくれたてんてん変換)。

使った人は誰でも暗インストーラに手が伸びるそれがIME2007。

辞書の並びはおかしいし、一番変換して欲しい言葉はすんなり出ない。たとえば1つ前の文章を書いたとき、「ほしいスペース」では「ほしい」のままだ。そこでもう一度スペースを叩いて「欲しい」にする。「ほしい」「ほしい」これに関しては学習がフリップフロップなのな。でもすべて平仮名にするなら^Uで済むわけだから取りあえずは漢字にしといて欲しい(これは最初平仮名だった。というか、入力直後は何もしなくても平仮名なんだからスペース叩いて最初が平仮名というのはなかなか素晴らしいアイディアだと思う)もんだよね。

というすばらしいIME2007だが今日のところはまだ固まりモードには入っていないのだけが救いだ。

で、最初にリンクしたKazzzさんのエントリのコメント欄でNyaRuRuさんが(末尾繰り返しパターンの名前が2つ続いた。artonon)「取材準備: IME開発」というChannel9のサポート記事を紹介してくれている。

IME2700とは直接は関係なさそうだが実に興味深い。

中でも新卒採用で入社した2名の開発者がIMEの開発において重要なポジションを任されていることです。

さすが、マイクロソフトだ。おもしろそうな仕事が経験に関係なく割り当てられるんだな。

どちらもタフな仕事でありながら、OJT (On the Job Training: 仕事を通じて学んでいくこと)により必要なスキルをつけていっているようです。

IMEの開発というなかなか大変そうな仕事をOJTで任せられるというのは技術者として相当な勉強になると思う。うらやましい。

IMEの開発の裏側を知っていただき、マイクロソフトがどう向き合っているのかをお伝えしたいものです。

なるほど。そういうふうに向き合っているのか。

追記:間違えた。日記書くときは、いらいらしたくないから、FirefoxではスタンダードIMEが動くようにしてたんだ。それで平仮名変換でうんざりはしたけど、止まったり考え込んだり引っかかったりはしなかったんだな、と大いに納得。

だから平仮名(と誉めてやろうとしたらいきなりスペース打ったら平仮名(まただ)に変換してくれたけど)についてはIME2007は無罪と思ったけど(平仮名(まただ3回目。やっぱり学習しない人だ))もっと悪かった。……(でも……はさすがに覚えてくれたらしい。ものすごく微妙なアルゴリズムで学習してるんだろう)。そしてちょっとでも難しい漢字を入れると考え込む(もちろん、その間にこちらはどの漢字/熟語を候補から選ぶか辞書をひけるわけだが)と思ったけど、漢字が難しいかどうかではなく、何か(なにかスペースでしばらく考え込んだわけだし)奥妙(おうみょうと読むのだがIME2007の辞書には無いらしい。でも「綯い」という言葉は登録されている)かつ玄妙(こちらはすぐ出た)な仕組み。僕もアンインストールしようかなぁ。と一瞬思わないでもないのだが、あまりに不可解な動きをするのでついつい使ってしまうのであった。でも、Firefox上ではスタンダードインプットにおそらく戻すかも。

追記:変換中に止まってしまい、ついリセットボタンに手が伸びる現象は、存在しないOutlookのアドレス帳がデフォルトで参照辞書に組み込まれているというバグ(だろう。存在しないんだから)が原因とわかったので、辞書からはずすと、相当ましになります(2007/6/5 追記)。

_ ちょっと待て

HTTPやFTPはダウンロードできるが、それだけだろ。

でも、あれは、共有できるんじゃなかったっけか?

ということだけは押さえておきたいスラドクォリティ。

本日のツッコミ(全6件) [ツッコミを入れる]
_ Kazz (2006-12-13 06:39)

Vista上だけ重くなるのであれば、まだネタとして看過できるのですがそれ以上ですからね。 -> IME2007<br><br>1GhzのCPU、256MbのPCでテストしてみたのかと。

_ arton (2006-12-13 11:10)

一応、2.8GHz Xeonで、4GBメモリーのマシンを使ってるんですが、しょっちゅう息継ぎされます。HDDも十分早いマシンだと思うんだけどそっちもあるのかな。<br>#日本語で凝った文章を書かないか、変換ミスを気にしない人がテストしたというだけかも(シアトルのほうの日本語勉強中で平仮名しか読み書きできないメンバーがテストしまくったとか)。

_ Kazz (2006-12-13 11:38)

>2.8GHz Xeonで、4GBメモリーのマシン<br> このスペックのPCで引っ掛かるでしたら、根幹部分に大きな問題があるに違いありません。いやそうあってくれないと困ります。<br><br> artonさんもそうみたいですが、こう凄いと逆にどこが性能上の問題なのか、調べたくなっちゃいますよね。

_ NyaRuRu (2006-12-13 17:44)

IME 2007 のアルゴリズムについては,この辺りが参考になります.<br>>VistaとOffice 2007、かな漢字変換の結果が違うのはなぜ?――IME 2007の開発者に聞く<br>http://itpro.nikkeibp.co.jp/article/NEWS/20061204/255812/<br><br>アルゴリズムの改良は,今回のように(今のところ?)凶と出る場合もありますが,たまに大当たりの場合もあって,プログラマ個人としてはやはり興味がある話です.<br>まあ Microsoft の場合,そういう実験的試みでも日本中や世界中に影響を及ぼしかねない怖さがあることは自覚して欲しいと思いますが.(罪のないイルカたちに謝れ!)<br><br>あと,恐るべき OJT の話は,もしかしたら Vista 標準 IME (か,その下で動く IMM32 API のエミュレーションレイヤ)の話なのかもしれません.<br>あっちはあっちで色々あるのでこれから大変ですが……

_ arton (2006-12-13 18:56)

お、興味深い記事をありがとうございます。これを読むと僕の変換スタイル(ブレやノイズを避けるために、基本的に単語毎に変換する。SKKの使い方に近いかも。上の例だと「平仮名」で変換「何か」で変換など)ではだめな点ばかりが目立つ結果になりやすいのかも知れませんね。あとは、増えた分の圧縮したデータの伸張を予測せずに即時にやろうとして失敗しているとかなのかな。

_ arton (2006-12-13 18:57)

OJTの話はね……成功すれば本気で良いことなんだけど、パッケージソフトである以上、結果がすべてだと思うしなぁ。


2003|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|09|10|11|12|
2012|01|02|03|04|05|06|07|08|09|10|11|12|
2013|01|02|03|04|05|06|07|08|09|10|11|12|
2014|01|02|03|04|05|06|07|08|09|10|11|12|
2015|01|02|03|04|05|06|07|08|09|10|11|12|
2016|01|02|03|04|05|06|07|08|09|10|11|12|
2017|01|02|03|04|05|06|07|08|09|10|11|12|
2018|01|02|03|04|05|06|07|08|09|10|11|12|
2019|01|02|03|04|05|06|07|08|09|10|11|12|
2020|01|02|03|04|05|06|07|08|09|10|11|12|
2021|01|02|03|04|05|06|07|08|09|10|11|12|
2022|01|02|03|04|05|06|07|08|09|10|11|12|
2023|01|02|03|04|05|06|07|08|09|10|11|12|
2024|01|02|03|04|05|06|07|08|09|10|11|12|

ジェズイットを見習え