小坂研究室

音声とコンピュータ

人間の音声をデータとして扱い，コンピュータで処理する技術を総称して音声情報処理と呼びます．人間の言葉を文字へ変換する音声認識，逆に文字を人間の言葉に変換する音声合成など様々な技術が含まれます．音声検索や歌声の合成など徐々に身近な技術となってきていますが，まだまだ未解決な問題が多くあります．本研究室では，このような音声に関わるさまざまな研究を行なっています．

人工知能(AI)と音声情報処理

数年前よりニュースなどで人工知能という言葉を頻繁に聞くようになりました．最近ではChatGPTのような言語生成AIをはじめとする生成系AIが注目を集めています．人工知能が注目されるようになったのは，機械学習の一手法であるディープラーニングの成功によるところが大きいと言えます．この機械学習と音声認識は，切っても切れない深い関係にあります．音声には様々な変動要因があり，これを認識するためには多数話者の大量データの分析が必要となります．このため古くから機械学習を利用してきました．ディープラーニングも，まず音声・画像認識分野で成功を収めました．現在では音声認識のみならず，音声合成，声質変換など，さまざまな音声情報処理技術に応用されています．ディープラーニングは一般的に計算量が多く時間がかかりますが，本研究室では科学技術計算用GPUを装備した計算サーバを多数揃え，高速計算を行なっています．

最新情報

2025.4.12
「進化するヒトと機械の音声コミュニケーション Vol.2」が発刊されました．小坂は3章第1節「音声による感情認識の開発」を担当しています[参照]．

2025.4.9
VRを用いたマルチモーダル対話システムVRAIMのプロジェクトを公開します[参照]．
内容については下記を参照してください．
細谷,関戸,小坂,「生成AIを用いたVR空間内3Dエージェントとのマルチモーダル対話システムの開発」日本音響学会春季講演論文集,2-2-5 (2025.3).

2025.3.20
学位授与式が行われました，当研究室学生が以下の通り表彰されました．おめでとうございます．
秦逸三記念賞　M2　小林清流さん，B4　丹野楓加さん
情報・エレクトロニクス専攻優秀発表賞　M2　小林清流さん
情報・知能コース優秀発表賞　B4　関根寿さん

2025.3.17-19
日本音響学会春季研究発表会において3件の発表を行いました．
M1　坂田一成さん　感情音声合成に関する研究[デモ]
M1　田崎晃基さん　楽曲の自動採譜に関する研究
B4　細谷謙多さん　マルチモーダル対話に関する研究

2025.3.8
東北地区若手研究者研究発表会でM2の小林清流さんが音声合成に関する発表を行いました．なお小林さんは優秀発表賞および音響学会東北支部若手研究者優秀論文賞 を受賞しました．おめでとうございます[賞状1] [賞状2]．

2025.2.22
情報処理学会東北支部研究会において3件の発表を行いました[資料]．
M2　小林清流さん　音声合成に関する研究
M2　柏倉直樹さん　歌声変換に関する研究
B4　関根寿さん　マルチモーダル対話に関する研究

2024.12.6
「AIを活用した音声認識技術と関連技術の展開」とのタイトルでセミナー講演を行いました．

2024.11.23
第7回東北地区音響学研究会において．田崎晃基さんが自動採譜，坂田一成さんがテキスト音声合成に関する発表を行いました．なお田崎さんは若手研究者優秀論文賞を受賞しました．おめでとうございます[賞状]．

2024.10.31
IEEE GCCE2024において小林清流さんがニューラルフォルマントボコーダについて，岸恵汰さんが音声感情認識について発表しました．なお小林さんはプレゼンテーション賞を受賞しました．おめでとうございます[賞状]．

2024.9.4
日本音響学会秋季研究発表会において小林清流さんがニューラルフォルマントボコーダについて発表しました[デモ]．

2024.8.24
電子情報通信学会ヒューマンコミュニケーション基礎研究会において細谷謙多さんがVRによる音声対話システムについて発表しました[デモ]．

2024.8.3
8/3(土)のオープンキャンパスで当研究室の研究内容のデモを行います．公開場所は7号館2階です．昨年の状況を見ると午前中は混雑しますが，午後は比較的空くようになります．
・VR音声対話
　ヘッドマウントディスプレイを使用し，VR空間内の仮想人物と自由に会話をします．
・音声合成・声質変換
　テキストから音声を生成する技術と，ある人の音声を他人の音声へ変換する技術の紹介です．
・水中トランシーバー
　レジャーダイバーが水中で会話することのできるトランシーバーの紹介をします．

2024.6.15
音学シンポジウム2024において関戸陽士さんがマルチモーダル対話システムについて発表しました．

2024.4.1
小白川キャンパスで4/16に開催されるDSCafeにおいて音声情報処理と応用に関する講演を行います．学内者の他，学外からも参加可能です．詳細はこちら．[ロゴシーズ公式facebook]

2024.3.20
学位授与式が行われました，4年の李天毅さんが工学部優秀学生賞および電子情報通信学会東北支部優秀学生賞を受賞しました．おめでとうございます．

2024.3.15-17
情報処理学会全国大会において千葉綾乃さんが歌声自動採譜について，李天毅さんが混合感情の音声合成について発表しました．また千葉さんはこの発表で学生奨励賞を受賞しました．おめでとうございます．

2024.3.1
感情音声認識に関する論文をTHE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMSにて発表しました [DOI: 10.1587/transinf.2023HCP0010]

2024.2.17
情報処理学会東北支部研究会において清水健太さんが声質変換について発表しました．

2023.12.3
音声言語情報処理研究会にて，岸恵汰さんが音声感情認識における話し言葉を考慮した言語特徴の利用について発表しました

2023.11.2
APSIPA-ASC2023にて，佐藤清秀さんが音声感情認識について発表しました [DOI: 10.1109/APSIPAASC58517.2023.10317325]

2023.9.28
日本音響学会　秋季研究発表会にて，岸恵汰さんが音声感情認識について発表しました

2023.8.26
電子情報通信学会　ヒューマンコミュニケーション基礎研究会(HCS)にて，細田尚輝さんがマルチモーダル対話システムについて発表しました

研究

小坂研究室では，音声認識を中心とした音声情報処理の研究を行っています．また機械学習応用の研究も行っています．主な研究テーマは以下の通りです． [詳細]

話し言葉の音声認識
マルチモーダル対話システム
声質変換
音声合成
音楽情報処理
機械学習応用

ページのトップへ戻る

山形大学大学院理工学研究科 / 工学部情報・エレクトロニクス学科

小坂研究室

KOSAKA LABORATORY

最新情報

研究

コンテンツメニュー

メンバー専用

研究紹介サイト

関連サイト

共同研究関連サイト