point 音声とコンピュータ

人間の音声をデータとして扱い,コンピュータで処理する技術を総称 して音声情報処理と呼びます.人間の言葉を文字へ変換する音声認識, 逆に文字を人間の言葉に変換する音声合成など様々な技術が含まれます. 音声検索や歌声の合成など徐々に身近な技術となってきていますが, まだまだ未解決な問題が多くあります.本研究室では,このような音声に関わるさまざまな研究を行なっています.

point 人工知能(AI)と音声情報処理 

数年前よりニュースなどで人工知能という言葉を頻繁に聞くようになりました.最近ではChatGPTのような言語生成AIをはじめとする生成系AIが注目を集めています.人工知能が注目されるようになったのは,機械学習の一手法であるディープラーニングの成功によるところが大きいと言えます.この機械学習と音声認識は,切っても切れない深い関係にあります.音声には様々な変動要因があり,これを認識するためには多数話者の大量データの分析が必要となります.このため古くから機械学習を利用してきました.ディープラーニングも,まず音声・画像認識分野で成功を収めました.現在では音声認識のみならず,音声合成,声質変換など,さまざまな音声情報処理技術に応用されています.ディープラーニングは一般的に計算量が多く時間がかかりますが,本研究室では科学技術計算用GPUを装備した計算サーバを多数揃え,高速計算を行なっています.

最新情報

2024.9.4
日本音響学会秋季研究発表会において小林清流さんがニューラルフォルマントボコーダについて発表しました[デモ]

2024.8.24
電子情報通信学会ヒューマンコミュニケーション基礎研究会において細谷謙多さんがVRによる音声対話システムについて発表しました[デモ]

2024.8.3
8/3(土)のオープンキャンパスで当研究室の研究内容のデモを行います.公開場所は7号館2階です.昨年の状況を見ると午前中は混雑しますが,午後は比較的空くようになります.
・VR音声対話
 ヘッドマウントディスプレイを使用し,VR空間内の仮想人物と自由に会話をします.
・音声合成・声質変換
 テキストから音声を生成する技術と,ある人の音声を他人の音声へ変換する技術の紹介です.
・水中トランシーバー
 レジャーダイバーが水中で会話することのできるトランシーバーの紹介をします.

2024.6.15
音学シンポジウム2024において関戸陽士さんがマルチモーダル対話システムについて発表しました.

2024.4.1
小白川キャンパスで4/16に開催されるDSCafeにおいて音声情報処理と応用に関する講演を行います.学内者の他,学外からも参加可能です.詳細はこちら.[ロゴシーズ公式facebook]

2024.3.20
学位授与式が行われました,4年の李天毅さんが工学部優秀学生賞を受賞しました.おめでとうございます.

2024.3.15-17
情報処理学会全国大会において千葉綾乃さんが歌声自動採譜について,李天毅さんが混合感情の音声合成について発表しました.また千葉さんはこの発表で学生奨励賞を受賞しました.おめでとうございます.

2024.3.1
感情音声認識に関する論文をTHE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMSにて発表しました [DOI: 10.1587/transinf.2023HCP0010]

2024.2.17
情報処理学会東北支部研究会において清水健太さんが声質変換について発表しました.

2023.12.3
音声言語情報処理研究会にて,岸恵汰さんが音声感情認識における話し言葉を考慮した言語特徴の利用について発表しました

2023.11.2
APSIPA-ASC2023にて,佐藤清秀さんが音声感情認識について発表しました [DOI: 10.1109/APSIPAASC58517.2023.10317325]

2023.9.28
日本音響学会 秋季研究発表会にて,岸恵汰さんが音声感情認識について発表しました

2023.8.26
電子情報通信学会 ヒューマンコミュニケーション基礎研究会(HCS)にて,細田尚輝さんがマルチモーダル対話システムについて発表しました

2023.3.15-17
音響学会にて北堀和佳さんが楽曲のコード認識について,佐藤清秀さんが音声感情認識について発表しました

2023.2.18
情報処理学会東北支部研究会において渡邉晴也さんがマルチモーダル対話システムについて,清水健太さんが声質変換について発表しました.

研究

小坂研究室では,音声認識を中心とした音声情報処理の研究を行っています.また機械学習応用の研究も行っています.主な研究テーマは以下の通りです. [詳細]

  • 話し言葉の音声認識
  • マルチモーダル対話システム
  • 声質変換
  • 音声合成
  • 音楽情報処理
  • 機械学習応用