Schluss mit Keywording: Final Cut 12 findet Shots auf Zuruf

Final Cut Pro 12 hat eine KI-Suche eingebaut die kaum jemand prominent erwaehnt. Du tippst was im Bild zu sehen ist — Final Cut findet's. Mein Praxis-Test mit drei Hochzeitsfilmen.

Final Cut 12 Visual Search Cover mit Lupe Suchleiste und Filmclips in ContentWerk Gruen
Drei Hochzeiten, 240 Clips, null Keywording — Final Cut 12 findet trotzdem den richtigen Shot.

Vier Stunden Footage. Drei Hochzeiten. Null Keywords gesetzt. Trotzdem hab ich den Shot in 12 Sekunden gefunden.

Final Cut Pro 12 hat seit Januar eine KI-Suche eingebaut, über die kaum jemand redet. Du tippst was im Bild zu sehen ist — und Final Cut findet es. Keine Tags. Kein Keywording. Kein "ah verdammt, wo war der Drohnen-Shot mit dem Sonnenuntergang nochmal".

Ich hab's an meinem eigenen Footage-Chaos getestet. Das Ding ist gut. Aber es hat einen Haken den dir die Apple-Marketing-Seite verschweigt.

Was Visual Search wirklich macht

Apple nennt das Feature Discover Visual Search. Klingt nach Marketing. Ist aber technisch ziemlich ehrlich beschrieben.

Final Cut analysiert deine Clips on-device. Das Modell läuft auf der Neural Engine deines Macs. Es erkennt Objekte → "Auto", "Hund", "Strand", "Glas Wein". Aktionen → "jemand rennt", "Person tanzt", "Hand winkt". Szenen → "Wolken", "Wasser", "Stadtkulisse bei Nacht".

Du tippst die Suche oben rechts ins Browser-Fenster. Und Final Cut zeigt dir alle Clips bei denen das Modell zustimmt.

Das ist der Punkt wo viele aussteigen: das Indexieren passiert nicht in Echtzeit. Final Cut muss erst durch dein Material durch. Bei mir auf dem M3 Max → 9,5 Stunden Footage in knapp zwei Stunden indexiert. Im Hintergrund. Während ich anderes geschnitten habe.

Mein Test: drei Hochzeiten, ein Chaos

Ich hab das absichtlich an einem realistischen Worst-Case getestet. Drei Hochzeitsfilme aus den letzten zwei Jahren. Etwa 240 Clips. Keiner hatte sauberes Keywording. Klassisch — du sagst dir "mach ich später" und dann wird es Mai 2026.

Suchanfragen die funktioniert haben:

  • "Brautstrauß werfen" → vier Treffer, alle korrekt
  • "Eltern weinen" → drei Treffer, einer war der Vater des Bräutigams beim First-Look (zählt)
  • "erste Tanz" → sieben Treffer, ein Fehlalarm wo zwei Gäste an der Bar standen
  • "Drohne Sonnenuntergang" → zwei Treffer, beide Volltreffer
  • "Ringe" → 14 Treffer inklusive eine Nahaufnahme einer Hand mit Smartwatch (versteh den Algorithmus)

Was nicht funktioniert hat: Namen. Logisch — Final Cut weiß nicht wer "Tante Renate" ist. Auch Stimmungen wie "lustige Reaktion" hat es geblockt. Bleib bei Objekten und Aktionen, nicht Emotionen.

Transcript Search obendrauf

Apple hat noch eine zweite Suche eingebaut die untergeht. Transcript Search. Final Cut transkribiert automatisch alles was gesprochen wird. Du suchst nach Worten und Phrasen — und springst direkt zur Sekunde im Clip wo es gesagt wird.

Für Interview-Lastiges Material → game-changer. Ich hab letzte Woche einen Cut für einen Coach gemacht. 90 Minuten Rohmaterial. Suchbegriff "der größte Fehler den meine Klienten machen" → drei Sekunden später war ich im richtigen Clip. Ohne dass ich mir Notizen gemacht hab.

Funktioniert auf Deutsch. Funktioniert auf Englisch. Bei Mischsprachen wird's wackelig.

Apple Silicon Pflicht — der Haken

Hier kommt der Teil den niemand laut sagt. Visual Search läuft nur auf Apple Silicon. M1, M2, M3, M4. Punkt.

Wenn du noch auf einem 2019er Intel-iMac schneidest → nope. Du bekommst Final Cut Pro 12 installiert, aber das Visual-Search-Feature ist deaktiviert. Apple sagt das nicht prominent. Steht versteckt in den System-Anforderungen.

Für mich war das egal. Für viele Editoren die ich kenne nicht. Wenn dein Mac älter als 2020 ist → Update auf 12 macht für dich nur halb soviel Sinn wie für mich.

Realistisch betrachtet: das ist Apples Strategie, dich auf neue Hardware zu schubsen. Nervt. Ist aber kein Bug, sondern Geschäftsmodell.

Wenn du das nicht nutzen solltest

Ehrlich → die Suche ist nicht für jeden gleich wertvoll.

  • Wenn du nur kurze Reels schneidest und 20 Clips auswählst — overkill. Du findest deine Shots auch so.
  • Wenn dein Material durchgehend gleich aussieht (Talking-Head-Studio, immer dieselbe Location) — bringt dir Visual Search wenig. Da hilft Transcript Search mehr.
  • Wenn du einen Editor unter dir hast der eh keywordet — ändere nicht das System. Lass den Menschen machen was er kann.

Wertvoll wird's wenn du:

  • regelmäßig Hochzeit / Event / Doku schneidest
  • viele Locations und viele Subjekte hast
  • alleine arbeitest und keine Zeit für Pre-Logging hast
  • alte Projekte aus dem Archiv wiederbeleben willst (das ist mein Lieblings-Use-Case)

Was das für deinen Workflow ändert

Ich hab seit drei Wochen aufgehört Keywording-Templates zu pflegen. Das ist verrückt — ich hab das zehn Jahre lang religiös gemacht. Jeder Clip kriegte Tags wie "wide_shot_outdoor", "interview_a-cam", "b-roll_lifestyle".

Jetzt nicht mehr. Ich importiere → lasse Final Cut indexieren → schneide. Wenn ich was suche, frag ich's auf Deutsch. Drei Wörter. Treffer.

Was ich noch tagge → die Sachen die das Modell nicht versteht. Storylinien. Charaktere. Klient-Branding-Farben. Den Rest macht die Maschine.

Die ehrliche Auswirkung: ich spar pro Hochzeitsfilm zwei bis drei Stunden im Pre-Logging. Bei zwölf Hochzeiten im Jahr → eine ganze Arbeitswoche. Auf Apple-Silicon-Hardware die ich eh schon hab.

Der nächste Schritt

Wenn du auf Apple Silicon bist → Final Cut auf 12 ziehen, ein altes Projekt aus dem Archiv aufmachen, Visual Search anwerfen, schauen ob's deine alten Shots wiederfindet. Das ist der Moment wo es klick macht.

Wenn du nicht auf Apple Silicon bist → schau dir DaVinci Resolve 21 an. Die haben in der Photo Page eine ähnliche Logik. Ist nicht ganz so smooth, aber funktioniert auf Intel-Macs und Windows.

Wenn du noch unsicher bist welcher Editor zu dir passt — komm in die ContentWerk Community. Da reden wir genau über sowas. Welche Tools wirklich Zeit sparen, welche nur Marketing sind, und wie du als Selbstständiger ohne Editor-Team trotzdem schnell durch dein Material kommst.

---

Auch interessant