スマートスピーカーAI開発日誌 その1
作成日時: | 2019年7月6日 |
更新日時: | 2019年7月7日 |
最近就職しました。
残業は今のところ無いですが、1日8時間取られるのでプログラミングの時間を確保するのが少し大変です。
この記事も昼休みに書いています。
ところで最近スマートスピーカーAIのプログラミングをしているのですが、なかなか楽しいです。
音声認識はJuliusとWatsonを併用し(短い音声はJulius、長い音声はWatsonで認識)、音声合成はOpenJtalkを使っています。
最初はJuliusだけを使っていたのですが、Juliusだと指定した単語、文しか認識できないため、どんな文章でも一応認識できるWatsonを使うようになりました。
しかしWatsonだと逆に短い音声コマンドが認識しづらかったため、JuliusとWatsonを併用することになりました。
今のところ一番役に立っている機能はめざまし機能です。
普通に指定した時刻になるとランダムに音楽をかけてくれます。
あと、当初はラズベリーパイに乗っける予定でしたが、画面で操作できるMac上で動かしておく方が便利なのでそうしています。
WebSocketを使ってWebから操作できるUIも作っています。というのもめざまし音楽を音声コマンドで止めることが困難だったので。
残業は今のところ無いですが、1日8時間取られるのでプログラミングの時間を確保するのが少し大変です。
この記事も昼休みに書いています。
ところで最近スマートスピーカーAIのプログラミングをしているのですが、なかなか楽しいです。
音声認識はJuliusとWatsonを併用し(短い音声はJulius、長い音声はWatsonで認識)、音声合成はOpenJtalkを使っています。
最初はJuliusだけを使っていたのですが、Juliusだと指定した単語、文しか認識できないため、どんな文章でも一応認識できるWatsonを使うようになりました。
しかしWatsonだと逆に短い音声コマンドが認識しづらかったため、JuliusとWatsonを併用することになりました。
今のところ一番役に立っている機能はめざまし機能です。
普通に指定した時刻になるとランダムに音楽をかけてくれます。
あと、当初はラズベリーパイに乗っける予定でしたが、画面で操作できるMac上で動かしておく方が便利なのでそうしています。
WebSocketを使ってWebから操作できるUIも作っています。というのもめざまし音楽を音声コマンドで止めることが困難だったので。