Gene Roddenberryが1964年に Star Trek を最初に思いついたとき、船のコンピュータに自然な発言を理解させることは、結局のところ明白な選択であった。テレポートはまだまだですが、音声認識は非常に重要です。 Dragon NaturallySpeakingは、現在バージョン12($ 200、購入のみ)で、このカテゴリのベテラン製品の1つです。それは高価ですが、Windows用の音声読み上げプログラムとしては最高のままです。
$ 200は、特に試用版を持たないプログラムの場合、大きな変化です。音声認識を生産的に使用するには、単なるソフトウェア以上のものが必要です。まともなマイク、静かな環境、キーボードを使用してテキストを作成するときとは異なる心構えが必要です。良い知らせは、音声認識に興味があり、試してみたいのであれば、それはおそらくあなたのシステムに組み込まれているということです。Windows Vista以降、Windowsの各バージョンには音声認識機能が含まれています。これはまた、ドラゴンが激しい競争に直面していることを意味します:試行なしの200ドルと、あなたのコンピュータに既にインストールされている無料のオプションとの比較です。
2つを比較するために、私はWikipediaの不思議の国のアリスについての段落をとり、両方の製品。非常に科学的な実験ではありませんでしたが、同じテキスト、コンピュータ、マイク、環境を使用しました。ドラゴンの演奏は目立って優れていましたが、主に段落にいくつかの固有の名前が含まれていたため、両方の結果が完全ではありませんでした。それでも、スピーチ認識があなたの仕事をより速く簡単にするかどうかを評価したい場合は、特にWindowsの音声認識が有効です。
Windowsの音声認識で提供される付加価値は、認識の質と追加機能という2つの形式で提供されます。単一段落のテストを無視して、私はドラゴンの認識が優れていることを発見しました。特に一般的な散文です。私は多くのエラーを訂正することなく、私の自然な声を使用して、そして私が他人に話すこととは異なった言い方をしたり話したりすることなく、長い電子メールを指示することができました。言い換えれば、Dragonのコア機能は成熟し、現場でテストされており、動作します。
定量化は難しいですが、以前のバージョンのNaturallySpeaking 11.5よりも少し速く正確です。ドラゴンが私の演説を誤解したときでさえ、それが提供する訂正の選択肢は、通常正確であり、私が実際に言っていたことをしばしば含んでいた(そして、そうでなかったときに、ドラゴンに新しい言葉を教えることができた)。
余分な特徴は、より均一ではない。ドラゴンNaturallySpeakingプレミアムにオーディオファイルをフィードしてテキストを転記できるようなものもあります。これにより、コンピュータを離れたり外出しているときにスマートフォンで音声を録音することができ、優れた結果が得られます。他の機能は磨かれていません:マイクを再調整せずに2つのUSBマイク(ウェブカメラやヘッドセットのような)を切り替える方法はありません
すべてのパワーで、Dragon's Optionsダイアログは簡単で簡単ですドラゴンはAndroidとiOS用のリモートマイクアプリをサポートし、スマートフォンをライブ口述用のワイヤレスマイクとして使用できます。 Androidアプリを設定するには、QRコードをスキャンすることができますが、私の場合、DragonのQRコードにはコンピュータのIPアドレスに関する情報が含まれていないため、Androidアプリがデスクトップアプリに接続できません仮想ネットワークアダプタではなく実際のネットワークアダプタ)。幸いにも、私がやったAndroidアプリを手動で設定することもできます。
Androidアプリは、携帯電話のディスプレイがオンになっていれば、ドラゴンとうまくいったが、オフにした瞬間、ディスプレイはオフになっていてもネットワークがネットワークに接続されていても機能しなくなった。
Dragon 12の新機能はWebmailとの統合です:Dragon 12にはブラウザ拡張機能が付いており、GmailやHotmailでの操作が可能です。私はGmailでそれをテストし、うまくいきました。受信者を選んで、件名を指定し、電子メールを指示しました。
竜の結果はWindowsの内蔵音声認識よりも優れていますが、固有名詞には手作業による修正が必要です。ドラゴン12の新機能は、ドラゴンの能力とコマンドの概要を説明する「スタートガイド」チュートリアルです。これはWindowsの音声認識チュートリアルよりもはるかに短くなっていますが、初心者にスピードをあげさせ、魅力的な音声認識を実現できることを歓迎します。
NaturallySpeakingには口述以外の多くの機能が含まれています。テキストの書式設定、アプリケーションの起動、Webの検索などを行うことができます。これらの機能の多くは、アクセシビリティニーズのあるユーザーには欠かせないものです。特殊な製品ではなく、Dragonのメインバージョンに組み込まれていることを確認することは素晴らしいことです。
Dragonのメリットを得るために、ただし、音声認識が環境やワークフローに適している場合、Dragonの優れたディクテーション機能だけで良い投資になります。
MicrosoftのMundies:マルチコアプロセッサは、マイクロソフト社のトップ研究員は、マルチコアプロセッサが劇的に増加したことで、現実世界の仮想表現とユーザーの文脈上のニーズを満たす情報が混在するアプリケーションが可能になる、とマサチューセッツ工科大学で9日(木)しかし、このビジョンを実現するためには、コンピュータサイエンスのコミュニティは、並列プログラミング環境への移行を習得しなければならない、とCraig Mundie最高研究責任者(CTO)はTechnology Review EmTechカンファレンスで出席者に語った。これには、プログラミングツールの複雑さを隠すモデリング技術と、人間の感覚に相当するコンピュータビジョンのようなマシンビジョンなどのセンシング技術にも取り組む必要があります。
Mundieはマイクロソフトの研究の幕の後ろに新たな覗き見を提供しませんでしたその代わりに以前に共有したアイデアやデモを主に提示しています。最も魅力的なのは、「ファーストライフ」(バーチャルオンラインプレイグラウンド「セカンドライフ」とは対照的に)と呼ばれるコンセプトに基づいたアプリケーションでした。
Fallout 3 Review:信じられないほどのロールプレイングゲーム、Lousy Ending
Bethesdaの驚くほど荒れ果てたFallout 3の最高のビットを楽しんでみたいなら、
Crayon Physics Review:ニュートンの色で世界を描く
KloonigamesのCrayon Physicsでは、仮想のクレヨンで世界をプレイできます。物理学、落書き、落書きが存在するまでにはぎこちない。ラインはライフラインになります。直角は括弧、中括弧、支点さえなります。円は斜面を滑り落ち、カラフルでカラフルな風景の周りに不規則なワックス状のビットを浮かび上がらせたり揺らしたりします。子供のスクラップブックのページが折り目がついたキャンバスの上を飛び回っているように、赤と緑、黄色、青のぼんやりとした道が徐々に現れます。