Sora 2:文本到视频示例与提示
OpenAI 的 Sora 2 是一个文本到视频模型,通过精确的提示结构生成真实且可控的视频片段。本文基于 OpenAI 的官方信息,阐述工作原理、推荐的提示组成部分以及对 Sora 2 的应用可能性。
Sora 2 基础
Sora 2 是 OpenAI 目前的文本到视频模型,具有更强的可控性、更加真实的运动和同步的音频。它是可用的。 Sora-App und im Web 提示的创建遵循清晰的构件:画面截取、分步动作、光线/颜色和音频提示。关于如何详细编写提示的说明,可以在 OpenAI 的帮助页面找到。 OpenAI Cookbook. 在网页/应用中的剪辑时长和操作因界面与计划的不同而有不同的限制,OpenAI 在其帮助页面和文章中不断明确。 帮助页面 和 文章 持续具体化。
Sora 2 的目标是创建像微型导演指令一样工作的剪辑——主题、场景、镜头、光线、动作、音频——并据此生成带同步音频的短视频。OpenAI 推荐的提示结构就像分镜:先定取景,其次以节拍进行动作,再配上光/色以及一个简单、可信的流程。
OpenAI 于 2025 年 9 月 30 日 发布了 Sora 2。重点在于物理一致性、可控性提升以及整合音频。 系统图 描述了安全措施,如下载时通过 C2PA 元数据的来源证明,以及对人物相似性的界限。Sora 2 的目标是为社交剪辑、B-roll 或学习片段提供一个门槛低的创作环境,不需要布景但具备电影化叙事语法。这里的提示设计是关键杠杆:视角、情节和光线越清晰,结果越稳定。同时,真实人物/品牌的来源证明与保护规则被视为必要的引导边界。

Quelle: opencv.org
OpenAI Sora:改变内容创作的文本到视频生成器。
按体裁提示示例
以下示例展示了在不同体裁中,详细的提示如何带来具体且高质量的视频片段。每个示例的结构都明确地定义了 Sora 2 的关键要素。
电影化的自然与旅行
这些提示专注于以电影美学制作富有氛围的自然和旅行视频。
Weites Luftbild über einer zerklüfteten Atlantikküste bei Golden Hour; Kamera: ruhiger Vorwärtsflug auf 60 m Höhe, sanfter Tilt nach unten; Aktion: Wellen brechen in gleichmäßigen Intervallen, zwei Möwen kreuzen; Licht: warmes Gegenlicht, lange Schatten, dezenter Lens Flare; Ton: leises Meeresrauschen, einzelne Möwenschreie.
Nebliger Bergwald im Morgengrauen; Kamera: langsamer Dolly durch Farn im Vordergrund, Fokus zieht von Farn zu sonnenbeschienenen Baumstämmen; Aktion: Nebelfahnen lösen sich; Licht: kühles Streulicht; Ton: Waldatmo, entfernte Amsel, feuchte Schritte im Laub.
Drohnenähnliche Totale über Reisfeldern; Kamera: Top-Down, langsamer Orbit mit 15 Grad Neigung; Aktion: ein Moped fährt über den Damm, Wasser kräuselt sich; Licht: weiches Morgenlicht; Ton: Insektenzirpen, leises Motorbrummen.
Winterlicher Fjord; Kamera: statische Totale, spiegelglattes Wasser; Aktion: kleines Fischerboot zieht von rechts nach links eine dünne Welle; Licht: kaltes Blau, milde Bewölkung; Ton: leises Plätschern, ferne Möwe.
Endlose Wüstenstraße bis zum Horizont; Kamera: bodennahe Stoßstangen-Perspektive; Aktion: Hitzeflimmern, Staub wirbelt kurz auf; Licht: hartes Mittagslicht; Ton: trockener Windstoß, entfernte Zikaden.
产品 B-roll 与微距
这些提示非常适合制作产品视频和细节拍摄。
Matt-schwarzer Over-Ear-Kopfhörer auf dunklem Holz; Kamera: Makro, langsamer Push-in; Aktion: Ohrpolster drehen sich minimal, Magnet-Click; Licht: kaltes Kantenlicht, warmes Fill links; Ton: dezentes Click, sanfter Synth-Whoosh.
Edelstahl-Armbanduhr auf Schieferplatte; Kamera: 45-Grad-Schwenk, Fokus auf Lünette; Aktion: Sekundenzeiger gleitet flüssig; Licht: hartes Spitzlicht mit klaren Reflexen; Ton: leises Ticken, Stoffrascheln.
Smartphone in Hand; Kamera: Over-Shoulder, Tilt zum Logo; Aktion: UI-Animation pulsiert mit feinem Glow; Licht: softes Studiolicht; Ton: Finger-Tap, UI-Click, leiser Subbass.
Duftkerze zündet; Kamera: Supermakro, Docht im Fokus; Aktion: Flamme fängt, Wärmeflirren steigt; Licht: dunkle Umgebung, nur Kerzenlicht; Ton: Streichholz, leises Knistern.
Sneaker-Detail; Kamera: Gleitfahrt entlang der Naht; Aktion: Textur sichtbar, Ferse federt kurz; Licht: Dreipunkt-Licht, kühle Kante; Ton: weiches Schrittgeräusch, Stoffreibung.
食品与饮料
这些提示适合制作令人垂涎的食品与饮料视频。
Cappuccino-Zubereitung; Kamera: Top-Down; Aktion: Latte Art in Herzform gegossen; Licht: warm, Café-Atmosphäre; Ton: Dampflanze, Geschirrklirren, Raumhall.
Sushi auf Schieferbrett; Kamera: Makro, Dolly seitlich; Aktion: Sojasauce-Tropfen läuft in slow motion; Licht: weiches Seitenlicht; Ton: Essstäbchen klacken, leises Gießen.
Street-Food-Pfanne; Kamera: Handheld, mittlere Nähe; Aktion: Gemüse wird gewendet, kurze Stichflamme; Licht: satt und warm; Ton: Zischen, Stimmengewirr.
Eiswürfel fallen in ein Highball-Glas; Kamera: Slow-Motion, 120 fps-Look; Aktion: Spritzer steigen, Kondenswasser bildet sich; Licht: kühles Gegenlicht; Ton: Eis-Klirren, Kohlensäure-Prickeln.
Sauerteigbrot aus dem Ofen; Kamera: Close auf Kruste; Aktion: Kruste bricht, Dampf entweicht; Licht: warm und rustikal; Ton: knuspriges Knistern.
人物与微场景(虚构)
这些提示可用于创建具有人物互动的简短虚构场景。
Innen, Café am Fenster; Kamera: Halbnah auf zwei Freundinnen; Aktion: Person A hebt Tasse, Person B lacht kurz; Dialog: A "Das ist der Shot.", B "Und der Sound sitzt."; Ton: Geschirr, Straßenatmo.
Büroflur; Kamera: Verfolgung auf Hüfthöhe; Aktion: Person öffnet Glastür, Lichtstreif wandert über den Boden; Licht: kühle Bürolichter; Ton: Türgriff-Klick, Klimaanlage.
Wohnzimmer am Abend; Kamera: Stativ, 35 mm; Aktion: Kind baut Turm, Turm fällt in Zeitlupe; Licht: warm, Tischlampe als Key; Ton: Bausteine fallen, fröhliches Lachen.
Fitnessstudio; Kamera: Low Angle; Aktion: Kettlebell-Swing, fester Stand; Licht: hartes Toplight; Ton: Metallklang, kurzes Atmen.
Haltestelle im Regen; Kamera: statische Totale; Aktion: Bus spritzt Wasser, Person klappt Schirm auf; Licht: nasser Asphalt reflektiert Neon; Ton: Regen, Stadtbrummen.
运动与动态
这些提示用于制作动态运动与动作视频。
Longboard die Rampe hinab; Kamera: Verfolgung in Hüfthöhe; Aktion: kleiner Ollie über ein Blatt, sauberes Landen; Licht: später Nachmittag; Ton: Rollen auf Asphalt, Windstoß.
Hallenbasketball; Kamera: bodennah, 24 mm; Aktion: Crossover, Layup gegen das Brett; Licht: Hallenscheinwerfer; Ton: Ball-Dribble, Turnschuhe quietschen.
Kletterhalle; Kamera: Schulterhöhe, 50 mm; Aktion: Clip in Sicherung, Top-Out; Licht: neutral; Ton: Chalk-Reiben, kurzer Jubel.
Schwimmbad; Kamera: halb unter Wasser; Aktion: Sprung, Blasen steigen an die Oberfläche; Licht: Sonnenflecken auf Kacheln; Ton: dumpfes Eintauchen, Wasserrauschen.
Trailrunning im Wald; Kamera: Gimbal, leichte Handkamera; Aktion: Sprung über Wurzel, weiche Landung; Licht: gefilterte Sonne; Ton: Atem, Schritte in Kies.
教育与讲解视频
这些提示适合制作具有教育性和解释性的视频短片。
Labor-Top-Down; Aktion: Tropfen erzeugt Wirbel im Becherglas; Off-Sprecher: "So wirkt Viskosität."; Licht: neutral; Ton: leises Plätschern.
Geografie-Minute; Kamera: Whiteboard frontal; Aktion: Hand zeichnet Flussdelta, Pfeile für Sediment; Off: "Drei Arme bilden das Delta."; Ton: Filzstift über Tafel.
Mathe-Visual; Kamera: statisch; Aktion: Papier faltet sich zu einer Parabel; Off: "Quadratische Funktion als Faltlinie."; Ton: Papierknistern.
Geschichte-Snack; Kamera: Close auf altes Foto; Aktion: Zoom auf Datum mit weichem Fokuswechsel; Off: "Kontext in 20 Sekunden..."; Ton: leises Klicken.
Biologie-Makro; Kamera: Makro auf Blatt; Aktion: Zeitraffer einer Blattöffnung Richtung Licht; Off: "Phototropismus kurz erklärt."; Ton: dezente Naturatmo.
建筑与空间
这些提示用于对建筑空间和建筑物的可视化。
Moderne Lobby; Kamera: Dolly durch Glasflur; Aktion: wandernde Sonnenflecken auf dem Boden; Licht: hartes Mittagslicht; Ton: Schritte, Klimaanlage.
Altbau-Treppenhaus; Kamera: langsame Kreisfahrt um Geländer; Aktion: Staubpartikel im Lichtkegel; Licht: Fensterlicht; Ton: Holzknarzen.
Küchenrenovierung Vorher/Nachher; Kamera: identisches Framing; Aktion: schneller Morph über Match Cut; Licht: clean; Ton: weicher Whoosh.
Tiny House im Wald; Kamera: Außentotale; Aktion: Rauchfahne aus Schornstein; Licht: Golden Hour; Ton: Vögel, fernes Bachrauschen.
Dachterrasse bei Nacht; Kamera: Stativ; Aktion: Stadtlichter werden zu Bokeh; Licht: Neon und warmes Fensterlicht; Ton: leises Stadtbrummen.
风格实验(3D/动画/定格)
这些提示可用于以多种艺术风格创建视频。
3D-Papercraft-Stadt im Regen; Kamera: statisch; Aktion: Papierschirme wippen; Palette: Pastell; Ton: sanfter Regen.
Knet-Stop-Motion; Kamera: statisch; Aktion: Figur formt sich, winkt der Kamera; Licht: weiches Studio; Ton: leises Knetquetschen.
Isometrische Low-Poly-Küche; Kamera: Top-Down; Aktion: Pfanne brät ein Ei, Dampf steigt auf; Ton: Zischen.
Neon-80s-Vaporwave; Kamera: langsamer Push-in; Aktion: Palmen wiegen im künstlichen Wind; Licht: Neonmagenta/Cyan; Ton: schwebendes Synth-Pad.
Aquarell-Loop; Kamera: statisch; Aktion: Farbe läuft die Seite hinunter, trocknet; Ton: feuchter Pinselstrich.
广告/落地页片段
这些提示针对简短精炼的广告片段和着陆页内容进行了优化。
SaaS-Feature-Teaser; Kamera: Over-Shoulder; Aktion: Cursor triggert drei Kernfeatures als Micro-Animationen; Licht: clean; Ton: Klick, sanfter UI-Whoosh; Off: "In 15 Sekunden: klarer Mehrwert."
Handwerker-Service; Kamera: 45 Grad; Aktion: Werkzeugkoffer öffnet, drei Tools klappen auf; Licht: warm; Ton: Klick, Reißverschluss.
Event-Teaser; Kamera: schnelle Cuts aus Stadt, Bühne, Publikum; Aktion: Lichtwechsel auf der Bühne; Ton: Crowd-Aufblende, kurzer Beat.
App-Demo; Kamera: Smartphone-Makro; Aktion: Finger tippt, grafische Animation erklärt Ablauf; Licht: neutral; Ton: sanfter Tap.
Food-Delivery; Kamera: Haustür frontal; Aktion: Tüte wird übergeben, kurzer Blickkontakt; Licht: Tageslicht; Ton: Klingel, Schritte.
时尚与美妆
这些提示适合制作注重细节与美感的时尚与美妆视频。
Laufweg im Atelier; Kamera: Schiebefahrt; Aktion: Stoff weht, Nahaufnahme der Naht; Licht: weiche Kante; Ton: Stoffrascheln.
Make-up-Makro; Kamera: Close auf Lid; Aktion: Pinsel trägt Schimmer auf; Licht: Beauty-Setup; Ton: feiner Pinselstrich.
Schmuck-Makro auf Drehplatte; Kamera: Makro; Aktion: Facetten funkeln in Bewegung; Licht: harte Spots; Ton: leises Metallklingeln.
Sneaker On-Foot; Kamera: bodennah; Aktion: Schritt über Pfütze, Spritzer in Zeitlupe; Licht: kühles Gegenlicht; Ton: Wasser.
Friseurstudio; Kamera: Spiegelperspektive; Aktion: Schere schneidet, Strähne fällt; Licht: neutral; Ton: Scherenschnitt.
旅行与城市
这些提示适合呈现旅行体验和城市场景。
U-Bahn-Station; Kamera: Weitwinkel; Aktion: Zug fährt ein, Druckwelle bewegt Haare; Licht: Neon; Ton: Windstoß, Bremsen.
Marktgasse; Kamera: Handheld; Aktion: Obststände, Händler ruft kurz; Licht: sonnig; Ton: Stimmen, Papierknistern.
Rooftop-Skyline; Kamera: Stativ; Aktion: Lichtwechsel von Dämmerung zu Nacht; Licht: Stadtlichter; Ton: fernes Sirenensummen.
Kanäle mit Booten; Kamera: von Brücke Top-Down; Aktion: zwei Boote kreuzen, Wellenmuster; Ton: Wasser, Möwe.
Nachtregen auf Pflaster; Kamera: Makro auf Pfütze; Aktion: Tropfen bilden konzentrische Kreise, Neon spiegelt sich; Ton: Regen.
动物(不含真人)
这些提示可用于创建没有真人表演的动物短片。
Hund im Park; Kamera: bodennah; Aktion: Ballfang, kräftiges Schütteln; Licht: Nachmittag; Ton: Bellen, Halsbandklingeln.
Katze am Fenster; Kamera: Close; Aktion: verfolgt Staubkorn im Gegenlicht; Licht: warm; Ton: leises Miauen.
Aquarium; Kamera: seitlich; Aktion: Luftblasen steigen an Pflanzen vorbei; Licht: blaugrün; Ton: Blubbern.
Vogelbad; Kamera: Top-Down; Aktion: Flügelschlag, Wassertropfen spritzen; Licht: sonnig; Ton: Wasserplitsch.
Pferd auf Koppel; Kamera: Halbtotal; Aktion: kurzer Galopp, Staubfahne; Licht: Golden Hour; Ton: Hufschlag.
过渡与文本
这些提示用于创建过渡效果和文本叠加。
Typografie-Intro; Kamera: statisch; Aktion: Buchstaben wachsen aus Schatten, stabilisieren sich; Licht: gerichtete Kante; Ton: tiefer Whoosh.
Paper-Tear-Transition; Kamera: statisch; Aktion: Papier reißt und enthüllt Szene B; Licht: neutral; Ton: markanter Riss.
Glitch-Auflösung; Kamera: statisch; Aktion: Szene zerlegt sich in Pixel und rauscht aus; Licht: kühle Akzente; Ton: kurzer Daten-Glitch.
Match Cut; Kamera: identisches Framing; Aktion: Objekt A morpht zu Objekt B; Licht: konstant; Ton: kurzer Suck-In.
Light Sweep; Kamera: statisch; Aktion: Lichtstreif fährt über Logo; Licht: hoher Kontrast; Ton: sanfter Shimmer.
自然科学与宏观(美学)
这些提示聚焦于宏观尺度上自然科学现象的美学呈现。
Kristallwachstum im Zeitraffer; Kamera: Makro; Aktion: Verzweigungen bilden filigranes Muster; Licht: dunkler Hintergrund, Kantenlicht; Ton: sphärischer Drone.
Tintenwolke im Wasser; Kamera: langsame Seitenansicht; Aktion: Tinte expandiert in weichen Wirbeln; Licht: starkes Gegenlicht; Ton: sanftes Blubbern.
Kerzenruß-Schleier; Kamera: Makro; Aktion: Flamme flackert, Rauchfahne wellt sich; Licht: warm; Ton: leises Knistern.
Metallkügelchen auf Platte; Kamera: Top-Down; Aktion: Kugeln rollen zu geometrischem Muster; Licht: neutral; Ton: Klicken.
Seifenblase platzt; Kamera: Makro; Aktion: Film zieht sich ruckartig zurück; Licht: bunte Interferenz; Ton: kurzer Pop.
游戏/UI 可视化
这些提示针对游戏与 UI 可视化的创作进行了优化。
HUD-Overlay-Demo; Kamera: statisch; Aktion: Health-Bar füllt sich, Minimap pulsiert; Licht: dunkler Hintergrund; Ton: digitale Beeps, UI-Click.
Inventory-Animation; Kamera: Over-Shoulder auf Bildschirm; Aktion: Item wird aus Slot gezogen, Tooltip blendet ein; Licht: neutral; Ton: sanfter Tap.
Quest-Intro; Kamera: langsamer Push-in auf 3D-Karte; Aktion: Route zeichnet sich, Marker poppt; Licht: kühler Schimmer; Ton: Kartenrascheln, UI-Chime.
Skill-Tree; Kamera: statisch; Aktion: Knoten expandieren radial; Licht: glühende Kanten; Ton: weiches Aufploppen.
Endscreen-Stats; Kamera: frontal; Aktion: Zahlen rollen hoch, Medaille erscheint; Licht: metallischer Glanz; Ton: kurzer Fanfarenhit.
LOGO/品牌动效
这些提示适用于制作动画徽标和品牌动效。
Geometrische Formen formieren ein Logo; Kamera: statisch; Aktion: Kreis, Quadrat, Dreieck snappen magnetisch zusammen; Licht: High Key; Ton: Clicks, kurzer Whoosh.
Linienzeichnen; Kamera: statisch; Aktion: Ein einziger Strich zeichnet das Markenzeichen; Licht: weißer Hintergrund; Ton: Filzstift.
Partikel-Fade-In; Kamera: statisch; Aktion: feine Partikel sammeln sich zum Logo; Licht: glitzernd; Ton: leiser Shimmer.
Flüssige Morph-Transition; Kamera: statisch; Aktion: Gelartige Form fließt zur Wortmarke; Licht: transluzent; Ton: weiches Gluckern.
Neon-Outline; Kamera: statisch; Aktion: Kontur zündet nacheinander; Licht: Neon; Ton: elektrisches Summen.
季节性/场合
这些提示适用于季节性或场合相关的视频剪辑。
Silvester-Count-In; Kamera: Totale einer Skyline; Aktion: Zahlen 3-2-1 in Fenstern, Feuerwerk startet; Licht: Nacht; Ton: Countdown, Knallen.
Frühlingsblüte; Kamera: Makro; Aktion: Knospe öffnet sich in Zeitraffer; Licht: warm; Ton: Bienenbrummen.
Sommer-Pool; Kamera: halb unter Wasser; Aktion: Sprung, Perlen steigen; Licht: Mittagslicht; Ton: Eintauchen, Lachen.
Herbstlaub; Kamera: Slow-Motion; Aktion: Blatt fällt spiralförmig; Licht: golden; Ton: sanftes Rascheln.
Winterfenster; Kamera: Close; Aktion: Finger zeichnet Herz in Kondenswasser; Licht: kühl; Ton: leiser Atemzug.
音频/配音焦点(带同步音)
这些提示将重点放在同步音频和配音上。
Radiomoderation im Mini-Studio; Kamera: Halbnah; Aktion: On-Air-Lampe geht an; Dialog: "Willkommen zur Kurzstrecke, Thema heute..."; Licht: warm; Ton: Schalterklick, Raumhall.
Voice-over auf B-Roll einer Werkstatt; Kamera: Gleitfahrt über Werkzeuge; Off: "Drei Schritte, um saubere Kanten zu fräsen."; Licht: neutral; Ton: feines Metallklingen.
Interview-Schnipsel; Kamera: 2-Shot, Schulter an Schulter; Dialog: Q&A in zwei Sätzen; Licht: Softbox; Ton: dezentes Raumambiente.
Kochanleitung; Kamera: Top-Down; Off: "Bei 180 Grad zehn Minuten backen."; Licht: warm; Ton: Timer-Piepen, Backofentür.
Stadt-Atmo mit Off; Kamera: Totale eines Platzes; Off: "Warum Plätze wirken: Blickachsen und Sitzinseln."; Licht: Nachmittag; Ton: Straßenatmo.
时光流逝/时间
这些提示用于制作时间流逝视频。
Wolkenschatten über Feldern; Kamera: statische Totale; Aktion: Schatten wandern schnell; Licht: wechselnd; Ton: tiefer Wind.
Baustelle Tag zu Nacht; Kamera: fixe Position; Aktion: Kräne bewegen, Lichter gehen an; Licht: Dämmerung; Ton: ferne Maschinen.
Stadtverkehr; Kamera: Brückenperspektive; Aktion: Lichter ziehen als Trails; Licht: Nacht; Ton: Stadtbrummen.
Kerze abbrennen; Kamera: statisch; Aktion: Wachs fließt; Licht: warm; Ton: leises Knistern.
Pflanzenranke; Kamera: Makro; Aktion: Ranke windet sich um Stab; Licht: weich; Ton: Natur-Drone.
音乐与表演(虚构)
这些提示可用于制作虚构的音乐和表演视频。
Straßenmusiker an der Uferpromenade; Kamera: Halbnah; Aktion: kurzer Gitarrenriff, vorbeigehende klatschen; Licht: Abendsonne; Ton: Gitarrensaiten, Applaus.
Tanzstudio; Kamera: Spiegel, 35 mm; Aktion: zwei Achtel choreografiert, Freeze am Ende; Licht: neutral; Ton: Trittgeräusch, Beat.
Schlagzeug-Roll; Kamera: Over-Shoulder; Aktion: Stick-Spin, kurzer Fill; Licht: Bühnenlicht; Ton: knackiger Snare-Schlag.
Klavierdetails; Kamera: Makro auf Hämmer; Aktion: einzelne Töne; Licht: warm; Ton: leiser Raumhall.
Vocal Booth; Kamera: Halbnah; Aktion: Sänger spricht Hook-Line ein; Licht: gedimmt; Ton: Pop-Filter, trockene Stimme.

Quelle: updf.com
一个关于 Sora 细致而富有氛围的视频生成的示例,这里是一幕来自日本大城市的场景。
提示结构与结论
一个有效的 Sora 2 提示结构对于生成视频的质量至关重要。OpenAI 建议采用清晰而精确的分段,覆盖场景的所有相关方面。
Motiv/Setting; Kamera/Framing (Brennweite optional); Aktion in 1–2 klaren Beats; Licht/Farbstimmung; Ton (Ambiente/FX/Dialog/Off); optional: Stil/Material (z. B. Papercraft, Low-Poly), Tempo (Slow Motion/Timelapse).
向 Sora 2 提供精准输入,将获得清晰可读、协调一致的剪辑。定义取景、按节拍的行动、设定光线、明确音频——这就是简短的成功公式,如同在系统图中所述。 OpenAI Cookbook 如所述。版权、来源与透明度是必须遵守的,尤其在涉及个人和品牌时,如系统图中所述。 系统图 如上所述。对用户而言,这意味着用电影语言来撰写提示、测试变体并清晰地发布结果。

Quelle: user-added
OpenAI Sora:文本到视频——内容创作的未来。