Intelligent Technology for Robotics(ロボットのための知能技術)

Eye / watch(目 / 見る)

PUX


Ear / listen(耳 / 聞く)

コンピューターが人間の話す言葉を聞き取るための技術をディクテーション(dictation)、音声認識(Voice Dictation)、ASR(Automated Speech Recognition)などと言います。

openSMILE(リアルタイムに(音声)特徴量を抽出するユーティリティ)
AmiVoice(音声認識ソフトウェア)
NUANCE(音声認識ソフトウェア)
FuTrek(音声認識事業社) ATR-Trek(音声認識エンジン)
Fairy Devices(音情報)
Cortana(Microsoft)
SpeechRec (NTTIT)
OpenEars(未明)xcodeでの使い方

Platoformごとの音声認識のための標準API

Java
javax.sound.sampled

Windows
Speech API(SAPI)

Android
★ 
Google ASR
★ SpeechRecognizer

ツール

WaveSurfer


Mouth / speech(口 / 喋る)

コンピューターが人の言葉を音として喋る技術を音声合成、またはTTS(Text To Sppech)といい、そのような機能を提供するソフトウェアをスピーチシンセサイザー(Speech Synthesizer)とか、スピーチエンジン(Speech Engine)と言います。

Java / Multi Platform

FreeTTS
Digital Future Text to Speech SDK
AquesTALK

Windows

Microsoft Speech API (SAPI) 5.3
HOYA VoiceText
フロンティア・ワークス CeVIO

iOS

iOSで使える日本語OKな音声読み上げエンジン8種(TTS,音声合成)
OpenEars

Android
★ 
TextToSpeech (Android標準のTTS API)
N2(KDDI の TTS ライブラリ) アンドロイドで日本語音声出力(TextToSpeech):音声読み上げ


Brain / think(脳 / 考える/決定する)

言葉を理解する

日本語形態素解析

Cabocha(係り受け解析): 2015/01/24 0.69 リリース
★ lucene-gosen:最新 2014/09/03
Juman:最新 2014/12/22
Kakashi:最新 2014/03/18
★ MeCab:最新 2013/2/18 : 0.996リリース
★ ChaSen:最新 2011/11/08
EDA(係り受け解析)
KyTea(京都テキスト解析ツールキット)
opennlp(Apache 英語解析器)

言語処理の拡張

シソーラス

WikiPedia シソーラス:SIGWP

コーパス
KOTONOHA

オントロジー

  • OWL
  • RDF
  • SPARQL

コミュニケーション・ロボット/A.I.

Robi(ディアゴスティーニ)
Siri
しゃべってコンシェル
Annaに聞いてみよう
ぱん田一郎
オッケーGoogle
Pepper (Softbank)
al+(オルツ)
Cortana

CAIWA(バーチャルエージェント構築)


基盤技術

ROS(Robot Operating System)
V-Sidoぶしどー
RTM(Robotics Technology Middleware) by ASIT
RTLinux
VxWorks


普通のWebサービス

tz database

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google フォト

Google アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中