人工知能の核となる機能は「コストを削減し、効率を高める」ことです。この前提がなければ、特定のAIツールがどれほど先進的で素晴らしいかを語るのは、単なる概念のすり替えに過ぎません。
動画編集というと、プロだけができる仕事で、様々な編集ソフトを習得するにはかなりの労力が必要だと考える人も多いかもしれません。
上司があなたに重要な仕事を任せ、長いビデオのハイライトや重要な部分を短いビデオにカットするように頼んだとしたら、どうしますか?
例えば、上司が番組のインタビューに出演しました。マスターテープを受け取った後、上司からインタビューで自分が話した部分をカットするように依頼されました。どうしますか?
これをするには、残業して動画全体を1.5倍速で再生し、フレームごとに編集するしかないのでしょうか?もっと効率的な方法はないでしょうか?残業しないのが一番です。今日は仕事が終わった後、トランプ仲間と麻雀をする約束をしました。
大丈夫です。オープンソースの無料AI動画編集ツールが今あります。ワンクリックで動画を自動編集し、上記の作業を5分で完了できます。
FunClipは、中国のインターネット大手アリババが開発したオープンソースのAI編集ツールです。AI技術(アリババ同義音声研究所のオープンソースFunASR Paraformerシリーズモデル)を活用し、動画内の音声を高精度に認識します。認識結果のテキストに基づいて、必要なテキスト/話者を素早く選択し、動画クリップに切り抜くことができます。
FunClip の機能:
自動音声認識
FunClipは、高精度で正確な予測タイムスタンプを備えた音声認識のリーディングカンパニーであるAlibabaの産業グレードモデルParaformer-Largeを統合しています。これにより、ユーザーは音声認識を通じて動画内の特定のコンテンツを素早く見つけることができます。
ホットワードのカスタマイズ
動画の中には、人物名や特定のイベントなど、特に注目したい特定の単語が出てくることがあります。FunClipでは、統合されたSeACo-Paraformerモデルを通じてこれらのホットワードを指定し、認識精度を向上させることができます。
話者認識
FunClipはCAM++話者認識モデルを統合しています。この機能により、自動的に識別された話者IDに基づいて、特定の話者の動画セグメントを切り抜くことができます。これは、異なる話者を区別する必要がある動画クリップに非常に便利です。
ビデオの切り取り
認識結果からテキストセグメントを選択するか、話者を指定して切り取りボタンをクリックすることで、対応するビデオセグメントを取得できます。この機能により、ビデオ編集が簡単になります。タイムラインを手動でドラッグする必要がなくなり、時間を大幅に節約できます。
マルチクリップサポート
FunClipは、複数のセグメントに分割した動画編集もサポートしており、柔軟な編集機能を提供します。これにより、ユーザーはニーズに合わせて、より綿密に動画を編集できます。
FunClipはローカルにデプロイできます。つまり、コンピューターにダウンロードし、依存環境を設定することで、インターネット接続がなくても永続的に、そして無期限に無料で使用できます。もちろん、GitHubからオープンソースコードをダウンロードしてインストールする方法がわからない場合は、以下のウェブサイトにアクセスして無料で体験することもできます。
Githubプロジェクト アドレス: https://link.zhihu.com/?target=https%3A//github.com/modelscope/FunClip
マジックタワー体験ウェブサイト:
https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary
HuggingFace体験ウェブサイト:
https://link.zhihu.com/?target=https%3A//huggingface.co/spaces/R1ckShi/FunClip
操作はとても簡単です。
ステップ1:ビデオをアップロードする
2つ目のステップは、(動画に複数のスピーカーがいる場合)スピーカーを識別し、ホットワードを設定することです。このステップは個人のニーズに基づいており、選択しないことも可能です。
3番目のステップは、ビデオ内の言語を抽出して認識し、テキストに変換することです。
4番目のステップでは、前のステップで抽出したテキストから段落を「切り取るテキスト」にコピーしたり、「切り取る発言者」を入力して、AIがどの段落を切り取るかを認識できるようにすることができます。
5番目のステップは字幕パラメータを設定することです。このステップは必須ではありません。
ステップ6:ビデオを編集する
最終的に編集されたビデオは、ほぼ数秒で非常に速く生成されます。