recuius sample

by recaius-dev

GitHub Readme.md

RECAIUS音声認識APIサンプルアプリケーション

このプロジェクトは、RECAIUSの音声認識APIの利用方法を理解するためのサンプルアプリケーションです。

音声認識のサンプルアプリケーションはGoogle ChromeかFireFoxをご利用ください。Internet Explorer等では正常に動作しません。 正しく音声を認識させるためには、マイクの利用をおすすめしています。マイク付きのイヤホンなどお持ちでしたら、ぜひご利用ください。

configBaseModelについて

lib/recaius/speech2text/index.js の configBaseModelの役割について説明します。

configBaseModel は BaseModel をにたいして数字をアラビア数字で返すように設定を行うメソッドです。 日本語を認識する BaseModel では数字を漢数字で返却するようになっているので、BaseModelを設定して数字をアラビア数字で返却する設定をおこなっています。

音声認識APIを利用してテキスト化を行う場合、数字はアラビア数字の表示ほうが利用しやすいと考えられるためこの設定が推奨されます。

一方、このサンプルプログラムでは音声認識を呼び出すたびにBaseModelの設定を行っていますが、この利用方法は正しくありません。 本来は音声認識サービスを利用する初回で1回設定し、以後は、変更しないものです。

実際の利用に際しては、APIコールをするたびに設定するのではなく、初回のみ設定してください。

Description

このプロジェクトのアプリケーションを動作させる場合は、事前にRECAIUS APIのディベロッパー登録が必要です。 登録は、こちらのサイトから行えます。

ディレクトリの構成は下記のとおりです。

bin/
  www                 // 実行スクリプト
lib/                  // ライブラリ
  recaius/            // RECAIUS WebAPIのHelperクラス
    speech2text/      // 音声認識API
      index.js
public/               // フロント向けリソース
  javascript/
    speech2text.js
  styleseet/
    style.css
routes/               // ルーティング
  api/                // WebAPI
  page/               // Webページ
  index.js            // 
views/                // 画面のテンプレート
  layout.jade         // 共通テンプレート
  speech2text.jade    // 音声認識サンプル画面テンプレート

Requirement

node.jsをインストールして下さい。 推奨バージョンは長期サポート版の4系です。(2016年2月現在) 5系は動作未検証です。

音声認識のサンプルアプリケーションはGoogle ChromeかFireFoxをご利用ください。Internet Explorer等では正常に動作しません。 正しく音声を認識させるためには、マイクの利用をおすすめしています。マイク付きのイヤホンなどお持ちでしたら、ぜひご利用ください。

Usage & Install

ディベロッパーサイトのチュートリアルを参考にして下さい。

RECAIUS Developerサイトから送られてくるログイン情報(サービス利用IDとパスワード)は、プログラムに直接書き込むのではなく、環境変数に設定することをおすすめします。

なお、ログイン情報は、/routes/api/token.js で利用されています。 音声認識を行うモデルにより利用するサービス利用IDとパスワードが変更されます。

  var params = {
    serviceInfos: [
      {
        serviceName: 'speech_recog_jaJP',
        id: process.env.RECAIUS_ASR_JAJP_ID,
        password: process.env.RECAIUS_ASR_JAJP_PASSWORD
      },
      {
        serviceName: 'speech_recog_enUS',
        id: process.env.RECAIUS_ASR_ENUS_ID,
        password: process.env.RECAIUS_ASR_ENUS_PASSWORD
      },
      {
        serviceName: 'speech_recog_zhCN',
        id: process.env.RECAIUS_ASR_ZHCN_ID,
        password: process.env.RECAIUS_ASR_ZHCN_PASSWORD
      }
    ],
    expire: 300
  };

Proxyサーバーの利用

ご利用のネットワークがProxyサーバーを経由して外部にアクセスされている場合は、Proxyサーバー用の設定が必要です。 RECAIUS_ASR_PROXY という環境変数を設定することでProxyサーバー経由でのアクセスが可能です。

Herokuへのデプロイ

Herokuを利用する場合は下記のボタンをクリックし、ログイン情報を設定すれば簡単にアプリケーションがデプロイできます。

Deploy

Licence

  • MIT
    • This software is released under the MIT License, see LICENSE.txt.

本プログラムを利用して宣伝などを行う場合、こちらのサイトからご連絡ください。

Author

recaius-dev-jp