หน้าที่หลักของปัญญาประดิษฐ์คือ “ลดต้นทุนและเพิ่มประสิทธิภาพ” หากไม่กล่าวถึงว่าเครื่องมือปัญญาประดิษฐ์บางประเภทมีความก้าวหน้าและยอดเยี่ยมเพียงใด ก็เป็นเพียงการเล่นกับแนวคิดเท่านั้น
เมื่อพูดถึงการตัดต่อวิดีโอ หลายคนอาจคิดว่าเป็นงานที่เฉพาะมืออาชีพเท่านั้นที่ทำได้ และต้องใช้ความพยายามอย่างมากในการเรียนรู้ซอฟต์แวร์ตัดต่อต่างๆ
ลองนึกภาพว่าถ้าเจ้านายมอบหมายงานสำคัญให้คุณ และขอให้คุณตัดส่วนสำคัญหรือไฮไลท์ของวิดีโอยาวๆ ให้เป็นวิดีโอสั้นๆ คุณจะทำอย่างไร
ตัวอย่างเช่น เจ้านายของคุณเข้าร่วมการสัมภาษณ์รายการหนึ่ง หลังจากได้รับเทปต้นฉบับแล้ว เจ้านายก็ขอให้คุณตัดต่อส่วนที่เจ้านายพูดในการสัมภาษณ์ออกไปแยกต่างหาก คุณจะทำอย่างไร
วิธีเดียวที่จะทำได้คือทำงานล่วงเวลาเพื่อดูวิดีโอทั้งหมดด้วยความเร็ว 1.5 เท่า จากนั้นจึงตัดต่อทีละเฟรม มีวิธีอื่นที่มีประสิทธิภาพมากกว่านี้หรือไม่ ไม่ควรทำงานล่วงเวลา วันนี้ฉันนัดกับเพื่อนที่เล่นไพ่เพื่อเล่นไพ่นกกระจอกหลังเลิกงาน
ไม่สำคัญ ตอนนี้มีเครื่องมือแก้ไขวิดีโอแบบโอเพ่นซอร์สและ AI ฟรีแล้ว มันสามารถแก้ไขวิดีโอโดยอัตโนมัติด้วยการคลิกเพียงครั้งเดียว และช่วยให้คุณทำงานข้างต้นเสร็จภายใน 5 นาที
FunClipเป็นเครื่องมือแก้ไข AI แบบโอเพ่นซอร์สที่ผลิตโดย Alibaba ซึ่งเป็นบริษัทอินเทอร์เน็ตยักษ์ใหญ่ในประเทศ โดยใช้เทคโนโลยี AI (โมเดลซีรีส์ FunASR Paraformer แบบโอเพ่นซอร์สของ Alibaba Tongyi Voice Laboratory) เพื่อจดจำเสียงพูดในวิดีโอได้อย่างแม่นยำ โดยอิงจากข้อความในผลการจดจำ ผู้ใช้สามารถเลือกข้อความ/ลำโพงที่ต้องการได้อย่างรวดเร็วและครอบตัดเป็นคลิปวิดีโอ
คุณสมบัติของ FunClip:
การจดจำเสียงพูดอัตโนมัติ
FunClip ผสานรวมโมเดลระดับอุตสาหกรรม Paraformer-Large ของ Alibaba ซึ่งเป็นผู้นำด้านการจดจำเสียงพูดด้วยความแม่นยำสูงและการประทับเวลาที่แม่นยำ ช่วยให้ผู้ใช้ค้นหาเนื้อหาเฉพาะในวิดีโอได้อย่างรวดเร็วผ่านการจดจำเสียงพูด
การปรับแต่งคำร้อน
บางครั้งมีคำเฉพาะบางคำในวิดีโอที่เราให้ความสนใจเป็นพิเศษ เช่น ชื่อบุคคลหรือเหตุการณ์เฉพาะ FunClip ช่วยให้ผู้ใช้ระบุคำสำคัญเหล่านี้ได้โดยใช้โมเดล SeACo-Paraformer แบบบูรณาการเพื่อปรับปรุงความแม่นยำในการจดจำคำเหล่านี้
การจดจำผู้พูด
FunClip ผสานรวมโมเดลการจดจำลำโพงของ CAM++ ฟีเจอร์นี้ช่วยให้ผู้ใช้สามารถครอบตัดส่วนวิดีโอของลำโพงแต่ละตัวตามรหัสลำโพงที่ระบุโดยอัตโนมัติ ซึ่งมีประโยชน์มากสำหรับคลิปวิดีโอที่ต้องแยกแยะลำโพงแต่ละตัวออกจากกัน
การครอบตัดวิดีโอ
ผู้ใช้สามารถเลือกส่วนของข้อความในผลการจดจำหรือระบุลำโพงและคลิกปุ่มครอบตัดเพื่อรับส่วนของวิดีโอที่เกี่ยวข้อง ฟีเจอร์นี้ทำให้การตัดต่อวิดีโอเป็นเรื่องง่าย คุณไม่จำเป็นต้องลากไทม์ไลน์ด้วยตนเองอีกต่อไป ช่วยประหยัดเวลาได้มาก
รองรับหลายคลิป
FunClip ยังรองรับผู้ใช้ในการตัดต่อวิดีโอเป็นหลายส่วน ทำให้มีความสามารถในการตัดต่อที่ยืดหยุ่น ซึ่งหมายความว่าผู้ใช้สามารถตัดต่อวิดีโอได้ตามความต้องการอย่างพิถีพิถันมากขึ้น
FunClip สามารถติดตั้งในเครื่องได้ นั่นคือ ดาวน์โหลดลงในคอมพิวเตอร์และกำหนดค่าด้วยสภาพแวดล้อมที่ขึ้นอยู่กับโปรแกรมอื่น เพื่อให้สามารถใช้งานได้ถาวรและฟรีไม่จำกัดเวลา แม้จะไม่มีการเชื่อมต่ออินเทอร์เน็ต แน่นอนว่าหากคุณไม่ทราบวิธีดาวน์โหลดและติดตั้งโค้ดโอเพนซอร์สจาก GitHub คุณยังสามารถเข้าไปที่เว็บไซต์ต่อไปนี้เพื่อทดลองใช้งานฟรีได้
ที่อยู่โครงการGithub : https://link.zhihu.com/?target=https%3A//github.com/modelscope/FunClip
เว็บไซต์ Magic Tower Experience:
https://modelscope.cn/studios/iic/funasr_app_clipvideo/สรุป
เว็บไซต์ประสบการณ์ HuggingFace:
ภาษาไทย: https://link.zhihu.com/?target=https%3A//huggingface.co/spaces/R1ckShi/FunClip
การดำเนินงานก็ง่ายมาก
ขั้นตอนที่ 1: อัปโหลดวิดีโอของคุณ
ขั้นตอนที่สองคือการแยกแยะลำโพง (หากมีลำโพงหลายตัวในวิดีโอ) และตั้งค่าคำสำคัญ ขั้นตอนนี้ขึ้นอยู่กับความต้องการส่วนบุคคล และคุณสามารถเลือกที่จะไม่เลือกได้
ขั้นตอนที่สามคือการแยกและจดจำภาษาในวิดีโอและแปลงเป็นข้อความ
ในขั้นตอนที่สี่ คุณสามารถคัดลอกย่อหน้าจากข้อความที่แยกออกมาจากขั้นตอนก่อนหน้าไปยัง “ข้อความที่จะครอบตัด” หรือป้อน “ลำโพงที่จะครอบตัด” เพื่อให้ AI รู้ว่าจะครอบตัดจากย่อหน้าไหน
ขั้นตอนที่ห้าคือการตั้งค่าพารามิเตอร์คำบรรยาย ขั้นตอนนี้ไม่จำเป็น
ขั้นตอนที่ 6: แก้ไขวิดีโอ
วิดีโอที่แก้ไขขั้นสุดท้ายจะถูกสร้างขึ้นอย่างรวดเร็วมาก เกือบภายในไม่กี่วินาที