パーソナルコンピュータによる音声認識物語

以前IBMからMacintoshで使える音声認識ソフト「ViaVoice」がリリースされ、大きな話題となったが音声認識技術は大変魅力のあるものながら、その後記憶から消えたような感じもする。そんなことを考えながら、今回はパソコンにとっての音声認識を取り上げてみる。 


私がパソコンによる音声認識をはじめて体験したのは1982年4月のことで、米国に注文をしたコモドール社のPETというパソコン用のCOGNIVOX-1002という製品だった。 

page4_blog_entry302_1.jpg

※コモドール社PETというパソコン用の音声認識装置「COGNIVOX-1002」


この製品は当時主流だったBASIC言語により自由に使えたのが大きな魅力で、私も当時の月刊誌に載っていたゲームのプログラムリストにこの音声認識ルーチンを組み込み、楽しんだものだ。 
またApple II用としては1983年にスピーチリンクというマイクロフォン付きのカードが販売された。高価だったにも関わらず "音声認識" という魅力には抗しきれず、購入した思い出がある。
これらは利用者自身の声をデジタル化のうえでフロッピーディスケットに記録し、実際の利用時にマイクから入力される音声データとマッチングを測るもので、現在のものとは比較にならないほどシンプルなものだった。しかし1980年代前半にこの手の製品を実体験できたことは大変有意義なことだったと思う。 

さてご承知のように、Apple社にはKnowlege Navigatorというパーソナルコンピュータの未来を暗示させるひとつのコンセプトがあった。このコンセプトは前CEO...それもAppleからスティーブ・ジョブズ氏を追放したジョン・スカリー氏が積極的に推奨したコンセプトであったためか、最近はほとんどその名を聞くことがなくなった。しかし大学の教授が登場するKnowlege Navigatorのプロモーションビデオは大変魅力的であり我々に多くの夢を見させてくれた...。 

page4_blog_entry302_2.jpg

※かつてAppleが積極的に未来のMacintoshだと提唱していたKnowlege Navigator


このKnowlege Navigator最大の特徴はAI(人工知能)と親密な関係にある音声認識技術といっても過言ではないだろう。キーボードではなく、エージェントという一種のビジュアルな案内人と自然な会話でやりとりをしながら作業を進める様はパソコン究極の姿だといえる。したがって私たちは実用的な音声認識とか音声合成などという新しいテクノロジーはApple社からリリースされるのではないかと思っていたし事実そう願っていた。 
実際Apple社にはそれまでにも、音声認識技術としてSpeech Recognitionがあり、いわゆる音声合成技術としてはEnglish Text-to-Speechがあった。それぞれ変遷はあったものの進化を続けてきた技術だった。だからこそ、そうした技術をベースに少しでもKnowlege Navigator実現に近づけて欲しかったが、一時期Apple社がどん底時代が続いたこともあり、その後目立った進歩を見ることができないままだ。 
そのSpeech Recognitionにしてもディクテーション、すなわち読み上げた喋りがそのまま文章としてテキスト化する...ということが出来ない点が不満だという意見も多かった。 

ところで、1989年8月のボストンにおけるMacWorldExpoではVoice Navigatorという音声認識製品が大きな話題を集めていた。この製品は音声認識(英語)により、Macintoshのオペレーションを可能とするもので、カーソル移動やメニューの選択、そして簡単な図形を言葉で描かせることができたと記憶している。したがって、当然のことながらその小さなブースは連日大勢の人で埋まっていた。
 
page4_blog_entry302_3.jpg

※1989年8月、MacWorldExpo会場のVoiceNavigatorブース


小型のノートパソコン程度の本体とヘッドセット、そしてソフトウェアで構成されていたVoiceNavigatorは魅力的だった。Expoのブースで私も早速購入したものの忘れ去ることも早かった(笑)。 
思うに...技術としては誰しもが興味を持ち、それらを使った近未来への夢を語ることが出来たとしても、それが明日から自身の環境に関わってくるとなると俄然拒否反応が出てくるのが音声認識のユニークなところのような気がする。 
たとえ音声認識率が高くても、特別な場所・ケースでないかぎり、我々は声を出して何かをするといった流れには違和感があるだけでなく、私たちの仕事や作業形態がそれに合致していないのである。 
例えば近年IBM社が開発したViaVoiceはそのディクテーションを高精度で実現した製品だったからこそ、大きな話題となった。私も英語版と日本語版共に購入して使ってみたが、その完成度の高さには驚愕したし多くのメディアにも絶賛された。しかし、これまた一般企業や家庭において実際に活用され続けているという話はその後ほとんど入ってこない。 

page4_blog_entry302_4.jpg

※IBM社の音声認識ソフトウェア「ViaVoice」のマニュアル表紙


ただし、一部で完成した技術だという話しも聞くが、携帯電話で日本語を話すと例えば英語に翻訳して喋ってくれる...といった、本当の意味での携帯性と実用性を備えたシステムとなったときには確実に実生活に浸透するに違いない。 
またヒューマノイド(人型ロボット)との意思疎通には人間にとって自然な会話による方法が理想なのは分かりきっているし、すでにその一部は実用の段階に入っているというから、その恩恵を受けられる日も近いのではないだろうか。 
やはりテクノロジーは目的ではなく、手段なのだろう。どうも、テクノロジーはそれ自体が喝采されているうちは本物ではないのかもしれない。私たちの日常生活に自然に、場合によっては気がつかない形で入り込んだ技術ほど役に立つものなのかも知れない。
関連記事
メイン広告
ネットショップ先行販売
ブログ内検索
New web site
[小説]未来を垣間見たカリスマ  スティーブ・ジョブズ
ジョブズ学入門
WATCH 講座
大塚国際美術館ひとり旅
ラテ飼育格闘日記
最新記事
お勧めの新旧記事
カテゴリ
リンク
メールフォーム

名前:
メール:
件名:
本文:

プロフィール

appletechlab

Author:appletechlab

主宰は松田純一。1989年Macのソフトウェア開発専門のコーシングラフィックシステムズ社設立、代表取締役就任 (2003年解散)。1999年Apple WWDC(世界開発者会議)で日本のデベロッパー初のApple Design Award/Best Apple Technology Adoption (最優秀技術賞) 受賞。

2000年2月第10回MACWORLD EXPO/TOKYOにおいて長年業界に対する貢献度を高く評価され、主催者からMac Fan MVP’99特別賞を授与される。著書多数。音楽、美術、写真、読書を好み、Macと愛犬三昧の毎日。マネキン造形研究中。日本シャーロック・ホームズクラブ会員。日本リュート協会会員。ゆうMUG会員