funclip: wird viele Videoeditoren arbeitslos machen

Die Kernfunktion künstlicher Intelligenz besteht darin, „Kosten zu senken und die Effizienz zu steigern“. Ohne diese Prämisse ist es reines Konzeptspiel, darüber zu sprechen, wie fortschrittlich und beeindruckend ein bestimmtes KI-Tool ist.

Wenn es um Videobearbeitung geht, denken viele Leute, dass dies eine Arbeit ist, die nur Profis erledigen können und dass das Erlernen verschiedener Bearbeitungssoftware viel Aufwand erfordert.

Stellen Sie sich vor, Ihr Chef weist Ihnen eine wichtige Aufgabe zu und bittet Sie, die Highlights oder Schlüsselteile eines langen Videos in ein kurzes Video zu schneiden. Was würden Sie tun?

Nehmen wir an, Ihr Chef hat an einem Interview in einer Sendung teilgenommen. Nachdem er das Masterband erhalten hatte, bat er Sie, den Teil, in dem er im Interview sprach, separat herauszuschneiden. Was würden Sie tun?

Ist das nur möglich, indem man Überstunden macht, das gesamte Video mit 1,5-facher Geschwindigkeit überprüft und es dann Bild für Bild bearbeitet? Gibt es einen effizienteren Weg? Am besten, man macht keine Überstunden. Heute habe ich mich mit meinen Kartenspielfreunden verabredet, um nach der Arbeit Mahjong zu spielen.

Das spielt keine Rolle. Es gibt jetzt ein Open Source- und kostenloses KI-Videobearbeitungstool. Es kann Videos automatisch mit einem Klick bearbeiten und Ihnen helfen, die oben genannten Aufgaben in 5 Minuten zu erledigen.

FunClip ist ein Open-Source-KI-Bearbeitungstool des chinesischen Internetgiganten Alibaba. Es nutzt KI-Technologie (die Open-Source-Modelle der FunASR Paraformer-Serie des Alibaba Tongyi Voice Laboratory), um Sprache in Videos präzise zu erkennen. Anhand der Textergebnisse können Nutzer schnell den gewünschten Text/Sprecher auswählen und in einen Videoclip zuschneiden.

FunClip-Funktionen:

Automatisierte Spracherkennung

FunClip integriert Alibabas Industriemodell Paraformer-Large, das führend in der Spracherkennung mit hoher Genauigkeit und präzisen Vorhersagezeitstempeln ist. Dadurch können Benutzer durch Spracherkennung schnell bestimmte Inhalte im Video finden.

Hotword-Anpassung

Manchmal gibt es bestimmte Wörter im Video, auf die wir besonders achten, z. B. den Namen einer Person oder ein bestimmtes Ereignis. FunClip ermöglicht es Benutzern, diese Hotwords über das integrierte SeACo-Paraformer-Modell zu spezifizieren, um die Erkennungsgenauigkeit dieser Wörter zu verbessern.

Sprechererkennung

FunClip integriert das Sprechererkennungsmodell CAM++. Diese Funktion ermöglicht es Nutzern, Videosegmente bestimmter Sprecher anhand automatisch identifizierter Sprecher-IDs zuzuschneiden. Dies ist besonders nützlich für Videoclips, bei denen verschiedene Sprecher unterschieden werden müssen.

Videozuschneiden

Benutzer können im Erkennungsergebnis ein Textsegment auswählen oder einen Sprecher angeben und auf die Schaltfläche „Zuschneiden“ klicken, um das entsprechende Videosegment zu erhalten. Diese Funktion vereinfacht die Videobearbeitung. Sie müssen die Zeitleiste nicht mehr manuell verschieben, was viel Zeit spart.

Multi-Clip-Unterstützung

FunClip unterstützt Nutzer außerdem bei der Bearbeitung von Videos in mehreren Segmenten und bietet flexible Bearbeitungsmöglichkeiten. So können Nutzer Videos gezielter und individueller bearbeiten.

FunClip kann lokal bereitgestellt, d. h. auf den Computer heruntergeladen und mit abhängigen Umgebungen konfiguriert werden, sodass es dauerhaft und kostenlos auch ohne Internetverbindung genutzt werden kann. Wenn Sie nicht wissen, wie Sie Open-Source-Code von GitHub herunterladen und installieren, können Sie ihn auch kostenlos auf der folgenden Website ausprobieren.

Github -Projektadresse: https://link.zhihu.com/?target=https%3A//github.com/modelscope/FunClip

Magic Tower Experience-Website:

https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary

HuggingFace-Erlebniswebsite:

https://link.zhihu.com/?target=https%3A//huggingface.co/spaces/R1ckShi/FunClip

          

Die Bedienung ist sehr einfach.

Schritt 1: Laden Sie Ihr Video hoch

Der zweite Schritt besteht darin, die Sprecher zu unterscheiden (falls mehrere Sprecher im Video vorhanden sind) und Hotwords festzulegen. Dieser Schritt basiert auf persönlichen Bedürfnissen, und Sie können sich dafür entscheiden, keine Auswahl zu treffen.

Der dritte Schritt besteht darin, die Sprache im Video zu extrahieren, zu erkennen und in Text umzuwandeln

Im vierten Schritt können Sie Absätze aus dem im vorherigen Schritt extrahierten Text in den „Zu beschneidenden Text“ kopieren oder den „Zu beschneidenden Sprecher“ eingeben, damit die KI weiß, aus welchem ​​Absatz sie beschneiden soll.

          

Im fünften Schritt werden die Untertitelparameter festgelegt. Dieser Schritt ist nicht erforderlich.

Schritt 6: Bearbeiten Sie das Video

Das endgültig bearbeitete Video wird sehr schnell, fast in Sekunden, erstellt.


 

Leave a Comment

Your email address will not be published. Required fields are marked *