パーソナルコンピュータによる音声認識物語
以前IBMからMacintoshで使える音声認識ソフト「ViaVoice」がリリースされ、大きな話題となったが音声認識技術は大変魅力のあるものながら、その後記憶から消えたような感じもする。そんなことを考えながら、今回はパソコンにとっての音声認識を取り上げてみる。
私がパソコンによる音声認識をはじめて体験したのは1982年4月のことで、米国に注文をしたコモドール社のPETというパソコン用のCOGNIVOX-1002という製品だった。
※コモドール社PETというパソコン用の音声認識装置「COGNIVOX-1002」
この製品は当時主流だったBASIC言語により自由に使えたのが大きな魅力で、私も当時の月刊誌に載っていたゲームのプログラムリストにこの音声認識ルーチンを組み込み、楽しんだものだ。
またApple II用としては1983年にスピーチリンクというマイクロフォン付きのカードが販売された。高価だったにも関わらず "音声認識" という魅力には抗しきれず、購入した思い出がある。
これらは利用者自身の声をデジタル化のうえでフロッピーディスケットに記録し、実際の利用時にマイクから入力される音声データとマッチングを測るもので、現在のものとは比較にならないほどシンプルなものだった。しかし1980年代前半にこの手の製品を実体験できたことは大変有意義なことだったと思う。
さてご承知のように、Apple社にはKnowlege Navigatorというパーソナルコンピュータの未来を暗示させるひとつのコンセプトがあった。このコンセプトは前CEO...それもAppleからスティーブ・ジョブズ氏を追放したジョン・スカリー氏が積極的に推奨したコンセプトであったためか、最近はほとんどその名を聞くことがなくなった。しかし大学の教授が登場するKnowlege Navigatorのプロモーションビデオは大変魅力的であり我々に多くの夢を見させてくれた...。
※かつてAppleが積極的に未来のMacintoshだと提唱していたKnowlege Navigator
このKnowlege Navigator最大の特徴はAI(人工知能)と親密な関係にある音声認識技術といっても過言ではないだろう。キーボードではなく、エージェントという一種のビジュアルな案内人と自然な会話でやりとりをしながら作業を進める様はパソコン究極の姿だといえる。したがって私たちは実用的な音声認識とか音声合成などという新しいテクノロジーはApple社からリリースされるのではないかと思っていたし事実そう願っていた。
実際Apple社にはそれまでにも、音声認識技術としてSpeech Recognitionがあり、いわゆる音声合成技術としてはEnglish Text-to-Speechがあった。それぞれ変遷はあったものの進化を続けてきた技術だった。だからこそ、そうした技術をベースに少しでもKnowlege Navigator実現に近づけて欲しかったが、一時期Apple社がどん底時代が続いたこともあり、その後目立った進歩を見ることができないままだ。
そのSpeech Recognitionにしてもディクテーション、すなわち読み上げた喋りがそのまま文章としてテキスト化する...ということが出来ない点が不満だという意見も多かった。
ところで、1989年8月のボストンにおけるMacWorldExpoではVoice Navigatorという音声認識製品が大きな話題を集めていた。この製品は音声認識(英語)により、Macintoshのオペレーションを可能とするもので、カーソル移動やメニューの選択、そして簡単な図形を言葉で描かせることができたと記憶している。したがって、当然のことながらその小さなブースは連日大勢の人で埋まっていた。
※1989年8月、MacWorldExpo会場のVoiceNavigatorブース
小型のノートパソコン程度の本体とヘッドセット、そしてソフトウェアで構成されていたVoiceNavigatorは魅力的だった。Expoのブースで私も早速購入したものの忘れ去ることも早かった(笑)。
思うに...技術としては誰しもが興味を持ち、それらを使った近未来への夢を語ることが出来たとしても、それが明日から自身の環境に関わってくるとなると俄然拒否反応が出てくるのが音声認識のユニークなところのような気がする。
たとえ音声認識率が高くても、特別な場所・ケースでないかぎり、我々は声を出して何かをするといった流れには違和感があるだけでなく、私たちの仕事や作業形態がそれに合致していないのである。
例えば近年IBM社が開発したViaVoiceはそのディクテーションを高精度で実現した製品だったからこそ、大きな話題となった。私も英語版と日本語版共に購入して使ってみたが、その完成度の高さには驚愕したし多くのメディアにも絶賛された。しかし、これまた一般企業や家庭において実際に活用され続けているという話はその後ほとんど入ってこない。
※IBM社の音声認識ソフトウェア「ViaVoice」のマニュアル表紙
ただし、一部で完成した技術だという話しも聞くが、携帯電話で日本語を話すと例えば英語に翻訳して喋ってくれる...といった、本当の意味での携帯性と実用性を備えたシステムとなったときには確実に実生活に浸透するに違いない。
またヒューマノイド(人型ロボット)との意思疎通には人間にとって自然な会話による方法が理想なのは分かりきっているし、すでにその一部は実用の段階に入っているというから、その恩恵を受けられる日も近いのではないだろうか。
やはりテクノロジーは目的ではなく、手段なのだろう。どうも、テクノロジーはそれ自体が喝采されているうちは本物ではないのかもしれない。私たちの日常生活に自然に、場合によっては気がつかない形で入り込んだ技術ほど役に立つものなのかも知れない。
私がパソコンによる音声認識をはじめて体験したのは1982年4月のことで、米国に注文をしたコモドール社のPETというパソコン用のCOGNIVOX-1002という製品だった。
※コモドール社PETというパソコン用の音声認識装置「COGNIVOX-1002」
この製品は当時主流だったBASIC言語により自由に使えたのが大きな魅力で、私も当時の月刊誌に載っていたゲームのプログラムリストにこの音声認識ルーチンを組み込み、楽しんだものだ。
またApple II用としては1983年にスピーチリンクというマイクロフォン付きのカードが販売された。高価だったにも関わらず "音声認識" という魅力には抗しきれず、購入した思い出がある。
これらは利用者自身の声をデジタル化のうえでフロッピーディスケットに記録し、実際の利用時にマイクから入力される音声データとマッチングを測るもので、現在のものとは比較にならないほどシンプルなものだった。しかし1980年代前半にこの手の製品を実体験できたことは大変有意義なことだったと思う。
さてご承知のように、Apple社にはKnowlege Navigatorというパーソナルコンピュータの未来を暗示させるひとつのコンセプトがあった。このコンセプトは前CEO...それもAppleからスティーブ・ジョブズ氏を追放したジョン・スカリー氏が積極的に推奨したコンセプトであったためか、最近はほとんどその名を聞くことがなくなった。しかし大学の教授が登場するKnowlege Navigatorのプロモーションビデオは大変魅力的であり我々に多くの夢を見させてくれた...。
※かつてAppleが積極的に未来のMacintoshだと提唱していたKnowlege Navigator
このKnowlege Navigator最大の特徴はAI(人工知能)と親密な関係にある音声認識技術といっても過言ではないだろう。キーボードではなく、エージェントという一種のビジュアルな案内人と自然な会話でやりとりをしながら作業を進める様はパソコン究極の姿だといえる。したがって私たちは実用的な音声認識とか音声合成などという新しいテクノロジーはApple社からリリースされるのではないかと思っていたし事実そう願っていた。
実際Apple社にはそれまでにも、音声認識技術としてSpeech Recognitionがあり、いわゆる音声合成技術としてはEnglish Text-to-Speechがあった。それぞれ変遷はあったものの進化を続けてきた技術だった。だからこそ、そうした技術をベースに少しでもKnowlege Navigator実現に近づけて欲しかったが、一時期Apple社がどん底時代が続いたこともあり、その後目立った進歩を見ることができないままだ。
そのSpeech Recognitionにしてもディクテーション、すなわち読み上げた喋りがそのまま文章としてテキスト化する...ということが出来ない点が不満だという意見も多かった。
ところで、1989年8月のボストンにおけるMacWorldExpoではVoice Navigatorという音声認識製品が大きな話題を集めていた。この製品は音声認識(英語)により、Macintoshのオペレーションを可能とするもので、カーソル移動やメニューの選択、そして簡単な図形を言葉で描かせることができたと記憶している。したがって、当然のことながらその小さなブースは連日大勢の人で埋まっていた。
※1989年8月、MacWorldExpo会場のVoiceNavigatorブース
小型のノートパソコン程度の本体とヘッドセット、そしてソフトウェアで構成されていたVoiceNavigatorは魅力的だった。Expoのブースで私も早速購入したものの忘れ去ることも早かった(笑)。
思うに...技術としては誰しもが興味を持ち、それらを使った近未来への夢を語ることが出来たとしても、それが明日から自身の環境に関わってくるとなると俄然拒否反応が出てくるのが音声認識のユニークなところのような気がする。
たとえ音声認識率が高くても、特別な場所・ケースでないかぎり、我々は声を出して何かをするといった流れには違和感があるだけでなく、私たちの仕事や作業形態がそれに合致していないのである。
例えば近年IBM社が開発したViaVoiceはそのディクテーションを高精度で実現した製品だったからこそ、大きな話題となった。私も英語版と日本語版共に購入して使ってみたが、その完成度の高さには驚愕したし多くのメディアにも絶賛された。しかし、これまた一般企業や家庭において実際に活用され続けているという話はその後ほとんど入ってこない。
※IBM社の音声認識ソフトウェア「ViaVoice」のマニュアル表紙
ただし、一部で完成した技術だという話しも聞くが、携帯電話で日本語を話すと例えば英語に翻訳して喋ってくれる...といった、本当の意味での携帯性と実用性を備えたシステムとなったときには確実に実生活に浸透するに違いない。
またヒューマノイド(人型ロボット)との意思疎通には人間にとって自然な会話による方法が理想なのは分かりきっているし、すでにその一部は実用の段階に入っているというから、その恩恵を受けられる日も近いのではないだろうか。
やはりテクノロジーは目的ではなく、手段なのだろう。どうも、テクノロジーはそれ自体が喝采されているうちは本物ではないのかもしれない。私たちの日常生活に自然に、場合によっては気がつかない形で入り込んだ技術ほど役に立つものなのかも知れない。
- 関連記事
-
- 「iPhone」にも酷評があるようだが...いつものことだ! (2007/01/24)
- Apple iPhoneの素直な印象〜写真だけではその凄さは分からない! (2007/01/11)
- 社名変更はAppleの経営戦略の大幅な変更を意味するか?! (2007/01/10)
- デジタルアートに見る私とビル・ゲイツ氏の接点(ウソ〜笑) (2006/11/22)
- なぜMouseだったのか? マウスのボタンとシッポの物語 (2006/08/16)
- パーソナルコンピュータによる音声認識物語 (2006/06/15)
- スティーブ・ジョブズ氏に手紙を出したらどうなるか? (2006/04/25)
- 私製アップルロゴ入り「レターヘッド」物語 (2006/04/23)
- あのPIXAR社から株主総会案内が届いた (2006/04/19)
- アップルビジネス昔話し〜ベストプロダクト賞副賞は中古マック (2006/04/04)
- Appleロゴデザインとその変遷 (2006/04/02)