AIを使った音声圧縮で従来の圧縮を超えた技術「Encodec」が実現【GIGAZINE】

http://egg.5ch.net/test/read.cgi/scienceplus/1667356888/【元スレ】

今回の記事

1 2022/11/02(水) 11:41:28.82

AIを使った音声圧縮で従来の圧縮を超えた技術「Encodec」が実現
https://gigazine.net/news/20221102-ai-compress-audio/

2022年11月02日 08時00分

ガブリエル・シナエーブ氏らによるMeta AIの研究チームが、インターネットにおける音声の「圧縮」に対してAIを用いることで従来の圧縮よりもさらなる圧縮が可能である、という研究を発表しました。AIを用いた圧縮により、豊かなマルチメディア体験を楽しむことができると説明しています。

Using AI to compress audio files for quick and easy sharing

今日のインターネットにおいて「圧縮」はなくてはならない要素で、圧縮により、高品質な画像やストリーミングが可能になります。しかし、現状の圧縮技術には高速なインターネット接続と十分なストレージ容量が必要になり、高品質で中断のないインターネットは一部の人しか体験できません。

そこでMeta AIの研究チームは、AIを用いてオーディオデータを圧縮することを研究しています。AIを用いたアプローチでは、リアルタイムで音声を圧縮・伸長させ、最先端のサイズ縮小を実現することができると発表しました。今回の研究では64kbpsのMP3と比較して、約10倍の圧縮率をCD品質である48kHzサンプリングのステレオ音声で品質を落とすことなく実用化しています。

(略)

※省略していますので全文はソース元を参照して下さい。

みんなのコメント

2 2022/11/02(水) 11:49:56.61

圧縮データを再生したら捏造音声になってたアル

3 2022/11/02(水) 11:58:44.43

昔からあるオートエンコーダーでも65kbyteを4byteくらいへ圧縮できるよな

4 2022/11/02(水) 12:09:42.67

実物の音声を聞かなければなんとも

5 2022/11/02(水) 12:13:08.14

実物の音声を聞いた
たしかに圧縮はうまく出来てるんだろうが
CD音質というのはおそらく嘘だと思う

6 2022/11/02(水) 12:13:32.14

AIがファイル名を見てテキトーに考えて音を合成する様にすると、全ての音データは数バイトで表現できるようになる。

7 2022/11/02(水) 12:28:22.93

音声圧縮なのにmp3と比較の時点でなあ
AMRと比較しないと同じ土俵にならないでしょ

10 2022/11/02(水) 12:48:30.25

これトレーニングしたモデルは
他の音源でも同じように圧縮に使えるの?

14 2022/11/02(水) 13:05:08.68

圧縮率上げると時間かかるんだよな
ものによるしな

16 2022/11/02(水) 13:25:13.22

というか音声サンプルではチリンチリン鳴るアレの音が一切しないな
可聴域の音まで削れてるわ

17 2022/11/02(水) 13:58:08.89

年寄りとか女の話が長いから
要約してくれるAIはないかな

21 2022/11/02(水) 14:58:30.05

楕円関数の暗号化技術を使う?

22 2022/11/02(水) 14:59:50.79

インターネットでは多くの場合、音声と動画像はセットで扱われることが多い。
音声の圧縮率が上がっても、全データ量には、ほとんど影響しないダロ。

23 2022/11/02(水) 15:06:12.80

今、AM放送で使われている1000khzくらいの搬送波でも音声のデジタル化が出来そうだね。

27 2022/11/02(水) 16:21:55.45

理論家が一生懸命考えたものを機械学習で
ぶっ飛ばすとたまらんな

29 2022/11/02(水) 16:28:08.82

圧縮率上げると時間かかるんだよな
ものによるしな

33 2022/11/03(木) 07:16:15.58

そう思うと楽譜って圧縮率すごいな

35 2022/11/03(木) 17:36:23.94

クラウドストレージのデータは人知れずこういう学習に使われてんだろうな

37 2022/11/03(木) 19:26:51.43

送りAI青い空って曲だ
受けAI青い空のCDかけますね

圧縮率100万倍w
こうですかw

39 2022/11/03(木) 19:52:11.03

細かい事言うと非可逆と書いてあるけどな
というかなんで最近記事を見ないのが殆どなんだろう
ニュースの内容受けずに話して面白いか?

45 2022/11/04(金) 11:15:47.55

メタのAIチーム凄すぎない?
本業のクソっぷりと差がありすぎる

46 2022/11/04(金) 11:58:37.37

AIだから不可逆の意味が分からない
可逆なら可逆で相関関数と係数の決定に機械学習が介入して圧縮率向上する余地はある

50 2022/11/04(金) 17:35:59.46

「この部分の情報は捨ててもだいたいこうだろう」で圧縮技術が進んでくと
「こいつが喋るならだいたいこうだろ」に行きつくのかね
モザイク破壊みたいに


以上、【AIを使った音声圧縮で従来の圧縮を超えた技術「Encodec」が実現【GIGAZINE】 】でした。

もし気に入っていただけたらツイッターなどでぜひぜひシェアをお願いします。更新の励みになります。

タイトルとURLをコピーしました