Audio til MIDI vs. “jeg spiller det bare selv”: hvornår teknikken faktisk hjælper dig

Audio til MIDI vs. “jeg spiller det bare selv”: hvornår teknikken faktisk hjælper dig

“Hvorfor bliver min melodi til free jazz, hver gang jeg bruger audio til MIDI?”

Det spurgte en producer mig om på et kald for nogle måneder siden. Han havde prøvet at konvertere et vokal-hook til MIDI, og resultatet lød som en meget forvirret saxofonist.

Det er typisk dér, folk lander med audio til MIDI. Det kan være genialt, men kun når du bruger den rigtige metode til den rigtige type lyd og giver softwaren en fair chance.

Melodi vs. akkorder vs. trommer: 3 forskellige verdener

“Audio til MIDI” lyder som én funktion, men der er faktisk mindst tre forskellige opgaver:

  • Enkeltmelodi (vokal, bas, lead)
  • Akkorder (klaver, guitar, pads)
  • Trommer og percussion

De kræver ikke samme tilgang. Her er forskellene i praksis.

Type Hvornår det virker godt Typiske problemer Bedste brugsscenarie
Melodi (pitch to MIDI) Monofonisk, ren optagelse, stabil timing Vibrato skaber for mange noter, glide/portamento misforstås Vokal-hook til synth lead, basriff til ny bassynth
Akkorder Tydelige klaver/guitar-voicings, lidt langsommere tempo Fejl i udvidelser (7, 9, sus), mudret sustain Få progressionen ud på MIDI for videre arrangement
Trommer Separate lyde med klare transienter Ghost notes, flam, hi-hats spammer MIDI Sampled break om til tromme-MIDI du kan redesigne

Melodi er typisk det mest pålidelige, hvis kilden er ren og monofonisk. Trommer kan også være nemt, hvis der er plads mellem slagene. Akkorder er der, hvor folk oftest bliver skuffede, fordi softwaren gætter på komplekse voicings.

Så første spørgsmål før du klikker “audio til MIDI” er: Hvad vil jeg have ud af det? Melodi, harmonisk skelet eller groove?

Hvornår audio til MIDI ikke kan betale sig

Der er situationer, hvor det er hurtigere at spille eller tegne det selv. Her er nogle røde flag.

  • Stærkt autotunet vokal med hårde bends
  • Tætpakket pianostemme med sustainpedal og masser af overtoner
  • Loop med både trommer, bas og harmonik blandet sammen
  • Støjende optagelser fra telefon, øverum eller live

I de cases ender du ofte med at bruge mere tid på oprydning end på bare at:

  • Spille melodien ind igen på keyboard
  • Tegne akkorderne ud fra dine ører
  • Lægge et nyt trommebeat, der matcher følelsen

Hvis du primært vil kopiere ideen og ikke præcis hver nuance, er det næsten altid hurtigere at gå MIDI-vejen fra start og bruge audio som reference.

Der er også det juridiske aspekt hvis du arbejder med samples. Så snart du genskaber et loop for tæt, er du ovre i noget rettighedsjura. Jeg har skrevet om forskellen på MIDI, audio og claims i artiklen om at undgå problemer med loops og samples, hvis du vil dykke ned i den del.

Forbered audio: 6 tweaks der gør tracking markant bedre

De fleste audio-til-MIDI fejl sker, før du trykker konverter. En hurtig prep-rutine gør en kæmpe forskel.

1. Rens støj og rum

Pitch-tracking hader baggrundsrum, hiss og små klik.

  • Brug et simpelt gate eller strip silence til at fjerne mellemrum, hvor der ikke spilles/synges
  • Skru ned for rumklang og delay på kilden, hvis du selv har optaget den
  • Lav evt. et highpass-filter omkring 60-80 Hz på vokal, så sub-støj ikke forvirrer algoritmen

Du behøver ikke mastering-grade støjreduktion. Det vigtige er, at den tydelige tone er det mest fremtrædende i signalet.

2. Tjek monofoni (specielt til vokal og bas)

Pitch til MIDI-funktioner forventer typisk én tone ad gangen. Hvis to spor bløder sammen (dobbeltvokal, bas og guitar i samme optagelse), går trackingen i stykker.

Prøv:

  • At vælge et enkelt takes af vokalen uden doubles og harmonier
  • At bruge en version af bassen uden distortion/chorus, hvis du har flere
  • At undgå stereo-effekter og bredde under selve konverteringen

Du kan altid skifte tilbage til det “flotte” spor bagefter. Her jagter vi data, ikke lydkvalitet.

3. Stabiliser pitch og vibrato når det er nødvendigt

Kraftig vibrato, slides og glissando er musikalsk fedt, men pitch-algoritmer kan have svært ved at beslutte sig: er det én tone eller tre?

Hvis din konverter hele tiden laver små 1/16-noter op og ned, så prøv:

  • At køre vokalen igennem en pitch-corrector i “blød” tilstand med lav retune speed
  • At begrænse ekstrem vibrato (bare lidt) før konvertering
  • At klippe de mest ekstreme slides ud og håndtegne dem i MIDI bagefter

Vi taler ikke hård T-Pain autune, bare nok til at få stabil grundtone. Tænk “pitch-skelet”, ikke færdig effekt.

4. Klip tydelige fraseringer og transienter

Tracking bliver nemmere, hvis fraser starter og slutter nogenlunde rent.

  • Klip før konsonanter, så softwaren ser en klar start (specielt på “s”, “t”, “k”)
  • Til trommer: sørg for at transienterne ikke er klippet for tæt (lad 5-10 ms før slaget blive)
  • Lav korte clips af enkelte fraser i stedet for at køre hele sangen på én gang

Især på trommer handler det om, at algoritmen kan se “bumpet” tydeligt. Hvis du i forvejen arbejder med loops og tempojustering, giver det mening at kombinere det med teknikkerne fra artiklen om at få acapellas og samples i tempo.

5. Juster niveau og dynamik

For lavt signal giver fejl, for højt signal klipper og laver falske overtoner.

  • Sigt efter peaks omkring -6 til -3 dB FS
  • Brug en mild compressor (2:1, 3-4 dB gain reduction) for at tæmme de værste udsving
  • Undgå hård limiting, det kan godte transienter ud

Du kan tænke på det som en mini-version af det, jeg gennemgår i min guide om gain staging uden nørdestress. Stabilt signal, færre overraskelser.

6. Sæt tempo og grid rigtigt inden

Hvis klippet ikke ligger i rigtigt tempo, laver værktøjet mærkelig quantize og notelængder.

  • Align audio til projekttempo først (warp, time stretch, elastique, hvad din DAW nu kalder det)
  • Sørg for at downbeat omtrent ligger på et 1-tal i griddet
  • Trim så clip starter tæt på taktstart, hvis din DAW bruger det som reference

Så behøver du ikke kæmpe med 1/32 ghost notes, blot fordi tempoet var sat 3 BPM forkert.

Konvertering: de 3 vigtigste indstillinger du skal kende

Alle DAWs kalder det noget forskelligt, men der går nogle fælles parametre igen.

1. Tolerance / sensitivity

Det her bestemmer, hvor aggressivt værktøjet opdeler noter.

  • Til vokal og bas: skru tolerance en smule ned for at undgå unødige splits
  • Til trommer: skru tolerance op, hvis du vil have flere ghost notes og nuance med
  • Til akkorder: hold den i midten, og regn med manuel oprydning bagefter

2. Quantize under konvertering

Mange værktøjer tilbyder at quantize i samme hug. Jeg vil oftest anbefale:

  • Slå auto-quantize fra til vokal-melodier, eller brug højst 1/16 med low strength
  • Til trommer kan du godt vælge en grovere grid (1/16 eller 1/8) hvis du alligevel vil stramme det op
  • Til bas: ofte 1/16, men lad “swing” ligge til senere

Jeg foretrækker at have “rå” MIDI først og så arbejde groove ind med de værktøjer, jeg kender, f.eks. den type humanize-rutiner jeg beskriver i artiklerne om MIDI i Ableton og om humanize uden at miste punch.

3. Note length / sustain-detektion

Nogle værktøjer gætter på notelængde ud fra amplitude. Det kan give:

  • For korte noter på vokal, hvis tailen dør ud i rum
  • Alt for lange noter på trommer, hvor sustain ikke betyder noget

Hvis der er en “minimum note length”, så sæt den nogenlunde svarende til 1/16 ved typisk tempo (80-130 BPM). Hellere lidt for kort og forlænge selv end alt for langt og bruge tiden på at klippe.

Fast 7-trins oprydning i MIDI efter konvertering

Her er den rutine, jeg selv bruger, når jeg har konverteret audio til MIDI. Den tager 5-10 minutter, men sparer dig for meget irritation senere.

  1. Zoom ud og tjek de store fejl: helt forkerte cluster af noter, der tydeligt ikke hører til. Slet dem.
  2. Rens under-velocity: vælg alle noter, og sæt en minimum velocity (f.eks. 25-30), så små fejl ikke er uhørlige men stadig kan ses.
  3. Ret åbenlyst forkerte toner: spil loopet og flyt de få toner, der “skriger” falsk, til nærmeste skalatone.
  4. Merge micro-noter: hvis to noter ligger næsten oven i hinanden i pitch og tid, så merge dem til én længere note.
  5. Justér note-længder: til bas og lead vil jeg ofte have 1/8 eller 1/4 som udgangspunkt, ikke 37 mærkelige længder.
  6. Let groove-justering: brug quantize med lav strength (30-50 %) og evt. et groove-template hvis du har et.
  7. Ryd op i oktaver: hvis der pludselig ligger en tone to oktaver væk uden musikalsk grund, så flyt den til et realistisk register.

Gem gerne en lille MIDI-rutine som preset eller template, så du altid har en “audio til MIDI oprydnings-session” klar. Det passer fint ind i dine generelle MIDI-redigeringsvaner.

Case 1: Vokal-hook til MIDI-lead (monofonisk pitch to MIDI)

Lad os tage et konkret eksempel. Du har et 4-takters vokal-hook, du gerne vil lave til en synth lead.

Trin 1: Forbered vokalen

  • Vælg ét hoved-take uden harmoni og doubles
  • Highpass omkring 80 Hz, mild compression, fjern kraftig reverb/delay
  • Trim clippen til præcis de 4 takter, så den starter nogenlunde på 1-slaget

Trin 2: Pitch-stabilisering (valgfrit men anbefalet)

  • Kør gennem let pitch correction med retune speed på f.eks. 30-50 ms
  • Begræns correktionen til den skala, du er i (C-mol, G-dur osv.)
  • Eksporter eller freeze/flatten, så du har en ren, stabil version

Trin 3: Audio til MIDI-indstillinger

  • Vælg “monophonic” eller “melody” mode hvis det findes
  • Slå auto-quantize fra eller sæt strength lavt
  • Sæt sensitivity/tolerance til den lave side for færre noter

Trin 4: Oprydning i MIDI

  • Følg 7-trins-rutinen: fjern tydelige fejl, merge micro-noter, ret par falske toner
  • Sæt notelængder til et musikalsk grid (f.eks. 1/8, enkelte 1/16 som pickup)
  • Tilpas velocity så frasen føles naturlig og har en tydelig top på de vigtigste toner

Trin 5: Tildel synth og form lyden

  • Vælg en monofonisk synth lead-lyd (fx saw med lidt glide)
  • Sæt glide/portamento, så den matcher de oprindelige slides i vokalen
  • Automatiser filter eller mod wheel, hvis du vil have frasen til at “synge”

Her giver audio til MIDI faktisk mening, fordi det fanger fraseringen og små timing-detaljer fra din vokal, som kan være svære at programmere mekanisk.

Case 2: Baslinje til MIDI + ny bassynth

Nu tager vi en optaget baslinje, måske fra en gammeldags hardware-synth eller en rigtig elbas, og laver den til MIDI, så du kan layer eller erstatte lyden.

Trin 1: Vælg den reneste version

  • Hvis du har både en clean DI og en distortet/amp version, så brug DI til konvertering
  • Fjern tuner, chorus, kraftig saturation og andre effekter i denne fase
  • Highpass helt nede ved 40-50 Hz hvis der er meget rumlen

Trin 2: Del lange takes op

I stedet for at køre hele nummeret igennem på én gang, så split i:

  • Vers-bassektionen
  • Omkvæd
  • Eventuelle fills og variationer

Konverter én sektion ad gangen. Det giver typisk færre mærkelige fejl og gør oprydning mere overskuelig.

Trin 3: Konverter med fokus på timing

  • Vælg “monophonic”/“bass” hvis din DAW har den mulighed
  • Lad quantize være slået til, men med moderat strength (50-70 %)
  • Minimum note length omkring 1/16

Trin 4: Rens og stram op

  • Fjern dobbelt-slag, hvor to noter ligger næsten oven i hinanden på samme tone
  • Gå især efter slutningen af takter: mange algoritmer laver små ekstra noter lige før 1-slaget
  • Ensret notelængder, så du har en klar rytmisk figur (f.eks. korte 1/16 på pickup, længere 1/8 på hovedslag)

Trin 5: Layer og skift lyd

  • Send MIDI til en ny bassynth: en sub-bus, en FM-bas eller en mere aggressiv lyd til omkvæd
  • Behold original-basen lavere i mixet, hvis den har god karakter
  • Brug evt. sidechain på begge baslag i forhold til kick, så det hele stadig føles stramt

Her er styrken ved audio til MIDI, at du ikke skal spille din baslinje ind igen manuelt. Du får groove og notevalg med og kan koncentrere dig om lydvalg og low-end-balance. Hvis du arbejder meget med bund, kan det være værd at kigge i kategorien om bas og low end for flere idéer til, hvordan du holder orden i bunden.

Audio til MIDI vs. “jeg tegner bare selv” – hvad skal du vælge næste gang?

Jeg plejer at bruge denne tommelfingerregel:

  • Melodi med tydelig frasering (vokal, bas, lead): prøv audio til MIDI, især hvis fraseringen er det vigtigste
  • Akkorder: brug audio til MIDI for at få en skitse, men regn med at tegne om og forenkle voicings
  • Komplekse loops (meget rum, meget støj, mange lag): brug audio som reference, men byg det selv i MIDI
  • Trommer: brug audio til MIDI hvis du har klare, rene slag og vil redesigne lyden

Pointen er ikke at presse alt igennem audio-til-MIDI, bare fordi funktionen findes. Det er et værktøj, som er stærkt i bestemte situationer og tidsrøvende i andre.

Næste gang du står med et hook, en baslinje eller et loop og overvejer audio til MIDI, så tænk i den simple sammenligning: Får jeg mest ud af at analysere den eksisterende optagelse, eller er det hurtigere at spille idéen igen? Jo bedre du bliver til at vurdere det, jo mindre tid bruger du på at rette efter maskinen og jo mere tid kan du bruge på at lave musik.

Til pitch-to-MIDI og fin pitch-editing er Melodyne ofte bedst til præcision. Hurtige, indbyggede løsninger findes i Ableton (Convert Melody/Drums/Harmony) og Logic (Flex Pitch), mens iZotope RX, Spleeter eller HitnMix er gode til at isolere stems før konvertering. Prøv et par værktøjer og husk at dyrere ikke altid betyder bedre for lige netop dit materiale.
Start med at fjerne meget korte eller dobbeltstående noter og slå overlapping sammen, kvantiser mildt (20-60%) i stedet for hårdt, og ret octave-fejl eller konstante pitch-bends manuelt. Juster velocities og fjern maskeret vibrato ved at sammensmelte til én note-per-slag, så synthetiseren spiller stabilt og kan humanises bagefter.
Prøv først stem-separation (Spleeter, RX eller HitnMix) for at få renere harmonisk materiale, eller brug et chord-detection-værktøj for et skitse-skeleton. Hvis resultatet stadig er mudret, så hent kun akkordens grundtone/bass og genskab voicings manuelt på keyboard - ofte er det hurtigere og pænere end at rydde et fuldt polyfonisk resultat.
Brug hit-detection til at få nøjagtige transientpositioner og ekstrakt et groove-template fra originalen, så MIDI beholder micro-timing og swing. Kvantiser kun for at rette dårlig timing, ikke for at slette følelsen, og behold subtile ghost-notes ved at ekskludere meget korte hits fra fuld kvantisering.

Kaspar Lind arbejder som lydtekniker og MIDI-workflow konsulent med fokus på det, der gør musikproduktion flydende i praksis: stabil routing, lav latency og fornuftige arbejdsgange i din DAW. Han har været ham, der bliver ringet til, når en session knækker, når en controller pludselig sender dobbelt-noter, eller når et setup på papiret burde virke—men ikke gør det.

Han er uddannet fra Sonic College og har gennem årene haft fingrene i alt fra home studios med to inputs til mere komplekse hybrid-opsætninger med hardware synths, clock, MIDI thru, plugin-instrumenter og templates. Hans tilgang er altid pædagogisk og konkret: hvad skal du klikke på, hvad skal du måle/lytte efter, og hvordan får du en løsning, der holder i morgen også.

På Midispot skriver Kaspar især om MIDI i praksis: CC-mapping, velocity og groove, MIDI sync, export/import af MIDI-filer, samt klassiske fejlkilder som buffer size, drivervalg og dobbelt-monitorering. Han går mere op i at give dig en stabil “standard-opsætning”, du kan bygge videre på, end at jagte hurtige hacks.

Send kommentar

You May Have Missed

Midispot.dk er et kreativt musikunivers med fokus på MIDI og moderne musikproduktion. Her finder du guides til DAWs, synths og plugins — med praktiske workflows for både begyndere og øvede.

Kontakt

Har du et spørgsmål eller en idé til en guide? Skriv, så vender vi typisk hurtigt tilbage.

kontakt@midispot.dk