Notion AI meeting note の話者分離の話題 : hkob の雑記録 (483)

はじめに

hkob の雑記録の第483回目(連続56日目)は、Notion AI meeting note の話者分離の話題です。

Tratar さんのポスト

以下の連続ポストがありましたので、まとめておきます。

私たちの #1 ユーザーからのリクエストです。あなたはこれをずっと望んでいました。私も望んでいました。

今日から、Notion AI Meeting Notes は、1:1 ミーティングや一部のビデオ会議で誰が話しているかを特定できます!

これは私たちの最初の前進であり、積極的な研究分野なので、仕組みを説明させてください。

オンラインで 1:1 なら分離はできそうですね。オフラインでも1:1が分離できると嬉しいですね。

仕組み:

  • オーディオデータをすべてのソース(マイク、システムなど)にわたって分割します。
  • マイクで話しているのがあなただけの場合、それがあなただとわかります。
  • 他の誰が話しているかを判断するために、追加のシグナル(会議参加者など)を活用します。

メモに話者の情報があるとよさそうですね。会議の次第などに名前が載っているといいかも。

最初は人を正確にマッチングできない場合もあります — これは1対1では非常にうまく機能しますが、部屋に18人いるときはまだあまりうまく機能しません(まだ)。

良いニュース? これはv1で、今後数ヶ月で精度を向上させるためにさらに注力し、改善を続けていくつもりです。続報をお楽しみに、フィードバックをお送りください!

とりあえず v1 だけど出してみたという感じでしょうか。気になることがあればフィードバックしましょう。

本日、ユーザーの20%に向けて展開を開始します。毎日、より多くのユーザーを追加していきます。

おわりに

話者分離はいろんな人に尋ねられるものなので、サブセットでも導入されると嬉しいですね。

https://hkob.notion.site/hkob-16dd8e4e98ab807cbe3cf3cc94cdfe0f?pvs=4hkob.notion.site