Sora Video Prompt: Silvester-Rückblick
Dieser Workflow zeigt, wie aus Handyfotos ein emotionales, knapp einminütiges Silvester-Recap-Video entsteht. Dabei kommen KI-Videomodelle wie Sora, Pika und Runway sowie ein LLM für das Voiceover zum Einsatz.
Einleitung & Überblick
Smartphones und Apps wie Google Fotos oder PicCollage erstellen automatisch Jahresrückblicke aus Bildern und Clips. Der Google Photos 2025 Recap fasst Fotos und Clips zu einem visuellen Highlight-Reel zusammen, inklusive Statistiken und einer Schnittstelle zu CapCut für die Weiterbearbeitung mit exklusiven Templates. Apps wie CapCut, Videoleap, Canva oder PicCollage bieten fertige Templates, um Recap-Videos oder Diashows aus Fotos zu erstellen.
Gleichzeitig generieren KI-Videomodelle wie Sora von OpenAI, Runway Gen-2/Gen-4.5 und Pika Labs aus Textprompts und Bildern kurze Clips mit realistischer Bewegung. Der hier vorgestellte Workflow kombiniert diese Technologien: Handyfotos sortieren, ein Voiceover-Skript mit ChatGPT erstellen lassen und passende KI-Clips generieren. Diese werden dann mit den Originalfotos in einer Schnitt-App zu einem Silvester-Recap montiert.
Recap-Features von Google Photos, PicCollage und CapCut sind darauf ausgelegt, Jahresmomente emotional zusammenzufassen. Der 2025-Recap von Google Photos orientiert sich an Formaten wie „Spotify Wrapped“ und generiert automatisch eine Abfolge von Fotos, Clips, Grafiken und Statistiken. Videoleap positioniert seine Vorlagen als Möglichkeit, Erinnerungen in eine „epische Videostory“ zu verwandeln. PicCollage zeigt, wie Jahresrückblicke als Video-Collagen, Slideshows und Grid-Layouts erstellt werden können. Der emotionale Effekt entsteht durch die Abfolge der Momente, die besonders im Hochformat als Story, Reel oder Status direkt wahrgenommen werden. KI-Video ermöglicht es, diesen Rückblick mit stilisierten Übergangs- und Stimmungsclips zu ergänzen, die sich wie animierte Handyfotos anfühlen.
Workflow-Schritte
Der Silvester-Recap-Workflow gliedert sich in vier Schritte:
- Fotos sammeln & sortieren: Nutzer scrollen ihre Kamera in Monatsansicht durch. PicCollage empfiehlt 10–50 Lieblingsfotos als Basis.
- Dramaturgie definieren (ca. 60 Sekunden): Videoleap schlägt eine einfache Struktur vor: Highlights auswählen, in Templates laden, exportieren. Eine mögliche Dramaturgie ist Anfang–Mitte–Ende, z.B. Jahresbeginn, Höhepunkte, Abschied von 2025.
- Voiceover-Skript mit einem LLM wie ChatGPT schreiben lassen: OpenAI zeigt, dass ChatGPT als Story-Konsulent, Research-Assistent und Editor für Skripte genutzt wird. Unternehmen wie Waymark nutzen GPT-Modelle für individuelle Werbe-Skripte.
- Clips mit Sora, Pika und Runway erzeugen und in einer Schnitt-App montieren: Sora generiert aus Textbeschreibungen bis zu einminütige Clips. Runway Gen-2 bietet Text-zu-Video, Text+Bild-zu-Video und Image-zu-Video. Pika Labs verwandelt Textbeschreibungen, Standbilder und Videomaterial in animierte oder realistische Clips. Die fertigen KI-Clips werden mit Handyfotos in einer Schnitt-App wie CapCut, Videoleap, Canva oder PicCollage zu einem Silvester-Video montiert.
PicCollage empfiehlt, Fotos zu markieren, die Freude bereiten, und verschiedene Momenttypen zu mischen. Videoleap rät, Highlights bewusst auszuwählen. Für ein 60-sekündiges Video sind 20–40 Fotos und 3–5 kurze Handyclips ideal, da Recap-Templates oft begrenzte Slots haben. Eine mögliche Struktur ist: Jahresstart (1–2 Fotos), Frühling/Sommer, Herbst/Winter, Silvester-Stimmung und ein ruhiges Abschlussbild. Diese Struktur kann direkt in LLM-Prompts für das Voiceover übersetzt werden.
OpenAI dokumentiert, dass ChatGPT für Skripte genutzt wird. Pictory und Synthesia zeigen, wie mit ChatGPT Videoskripte generiert werden. Ein Basisprompt könnte lauten:
„Schreibe ein Voiceover-Skript (ca. 60 Sekunden) für ein Jahresrückblick-Video aus Handyfotos. Ton: leicht emotional, aber nicht kitschig, Zielgruppe: Freunde & Familie.“
Ergänzungen wie „Schwerpunkte: Umzug in neue Wohnung, erster Skiurlaub, neue Stelle im Sommer, kleiner Autounfall im Herbst, neue Nichte im November.“ oder „Bitte baue 2–3 sehr kurze humorvolle Sätze ein, die Insider-Momente anspielen (z. B. ewige Bahnverspätungen, gescheiterter Kuchenversuch an Ostern).“ sowie „Sprache: Duzen, direkt an Freunde & Familie gerichtet.“ helfen ChatGPT, das Skript anzupassen. Iteratives Prompting wird für Marketing- und Social-Videos empfohlen. Das fertige Skript kann als Textdatei gespeichert oder direkt in einer Schnitt-App verwendet werden, da viele mobile Editoren wie Videoleap und CapCut die Anpassung der Clip-Länge an ein Voiceover erlauben.
KI-Video-Werkzeuge
Für die Erstellung von KI-Clips stehen verschiedene Werkzeuge zur Verfügung:

Quelle: serokell.io
Sora generiert beeindruckende urbane Szenen.
Sora: Text-zu-Video mit Silvester-Atmosphäre
OpenAI beschreibt Sora als Text-zu-Video-Modell, das bis zu 60-sekündige Clips mit komplexer Kamerabewegung und mehreren Charakteren generieren kann. Die Sora-App ermöglicht die Erstellung hyperrealistischer oder stilisierter Videos mit Sound aus Prompts oder Bildern. Aktuell können in der mobilen App Videos bis zu 20 Sekunden Länge pro Generation erstellt werden, wobei Text, Bild- und Video-Uploads als Input dienen. Für den Silvester-Recap eignet sich Sora für atmosphärische Zwischensequenzen. Ein Beispiel für einen Sora-Video-Prompt für einen Silvester-Recap könnte sein:
„new year recap montage feel, handheld home-video style, city at night, warm street lights, subtle fireworks in the distance, soft depth of field, gentle camera movement, 10 seconds, cinematic but intimate, fits between smartphone photos of friends“
Zusätzlich kann ein Smartphone-Foto als Bild-Upload verwendet werden, um den Look der echten Fotos aufzugreifen.
Pika: Image-to-Video aus deinen Handyfotos
Pika AI wird als Browser- und App-basierter Generator beschrieben, der Textbeschreibungen, Fotos und Videomaterial in animierte oder realistische Clips verwandelt. Pika nennt Text-zu-Video und Image-to-Video als Kernfunktionen. Die Pika-Apps ermöglichen die Erstellung „fun videos“ mit Animationseffekten aus ausgewählten Fotos. Dies ist ideal, um einzelne Handyfotos als kurze Motion-Clips zu animieren, z.B. Konfetti oder Lichter in einer Gruppe von Freunden. Ein konkreter Prompt (Pika, Modus Text+Bild):
„new year recap montage, animate this smartphone photo, subtle parallax movement, warm film look, floating dust particles, light leaks, 5 seconds loop, looks like nostalgic home video“
Dabei wird das Handyfoto direkt hochgeladen und mit dem Prompt kombiniert.
Runway: Gen-2 / Gen-4.5 Clips für Übergänge und Symbolbilder
Runway beschreibt Gen-2 als Modell, das Videos aus Text, Text+Bild oder reinen Bildern erzeugen kann. Modi wie „Text to Video“, „Text + Image to Video“ und „Image to Video“ übersetzen Mockups, Storyboards und Stills in bewegte Szenen. Runway bewirbt seine Tools als Text-zu-Video- und Image-zu-Video-Generatoren. Die neueren Gen-4-Modelle bieten physikalisch plausiblere Bewegungen und cineastische Stile, ideal für abstrakte Symbolbilder im Recap, wie ein Zug, der ins neue Jahr fährt. Ein Prompt, der die gewünschte Struktur aufgreift, könnte so aussehen:
„new year recap montage, fast cuts of smartphone photos on a wooden table, camera gliding over printed pictures, warm film look, soft particles, 60 seconds, upbeat lofi background, text overlay: Goodbye 2025“
In der Praxis werden mehrere 5- bis 10-sekündige Runway-Clips mit ähnlichem Prompt erzeugt und in der Schnitt-App zusammengefügt.
Postproduktion
Die Montage der KI-Clips und Handyfotos erfolgt in einer Schnitt-App.
CapCut beschreibt Recap-Videos als „perfekte Lösung“ und bietet Templates, in die Fotos und Clips eingefügt werden. Der Google Photos 2025 Recap bietet einen „Edit with CapCut“-Button, der den Recap direkt an CapCut übergibt und exklusive Google-Photos-Templates bereitstellt. Videoleap positioniert sich als „intuitiver Video-Editor“ und empfiehlt für Recap-Videos: Template wählen, Medien hochladen, exportieren und teilen. Canva ermöglicht die kostenlose Umwandlung von Fotos in Videos. PicCollage bietet „New Year Recap Reels“, bei denen mindestens drei Fotos in ein Template eingefügt werden, um ein kurzes Video mit Animation zu erzeugen.
Der praktische Ablauf für den Silvester-Recap: Die KI-Clips aus Sora, Pika und Runway werden in CapCut oder Videoleap importiert. Dazwischen werden Blöcke aus echten Handyfotos gesetzt, oft mit Ken-Burns-Effekt. Das Voiceover kann als eingesprochene Tonspur oder als Text-Overlay mit Untertiteln hinzugefügt werden. Wichtig ist, dass die KI-Clips stilistisch zu den Handyfotos passen: gleiche Farbstimmung, ähnliches Seitenverhältnis (meist 9:16) und keine übertriebenen Effekte, um einen zusammenhängenden Jahresfilm zu erzeugen.
Musik & Sounddesign: Lofi-Hintergrund ohne Rechte-Stress
Für private und Social-Media-Recaps ist Musik mit passender Lizenz erforderlich. Pixabay bietet „Lo-Fi“- und „Lofi Chillhop“-Kategorien mit GEMA-freier Musik. Uppbeat stellt eine kuratierte Sammlung von Lofi-Beats für Content-Creator bereit. Bensound bietet eine Kategorie „lofi Royalty Free Music“. Es ist wichtig, die Lizenzbedingungen des jeweiligen Anbieters zu prüfen, ob der geplante Einsatz abgedeckt ist. Für öffentliche Posts auf TikTok oder Instagram können die internen Musikbibliotheken der Plattformen genutzt werden.
Fazit
Ein emotionales Silvester-Recap kann heute direkt auf dem Smartphone erstellt werden. Sensorik, Apps und KI liefern alle Bausteine, von der automatischen Google-Photos-Zusammenstellung bis zu Templates und Übergängen in Videoleap, CapCut, Canva und PicCollage. Ein klarer Voiceover-Prompt an ChatGPT legt den emotionalen Rahmen fest, den Sora-, Pika- und Runway-Prompts visuell ausfüllen. Das Ergebnis ist ein kurzes Video, das sich wie ein gemeinsamer Rückblick anfühlt, ergänzt durch KI-Magie.