Kvalitetsförbättring vid konvertering från mp3 till waw?
Postad 11 April 2008 - 10:13
Ni kanske ska ställa en fråga här och få saken utredd. Josh Coalson brukar hålla till där.
Bra idé, nån som redan är medlem där kanske kan skriva en fråga ?
Själv hänger jag där en del och läser, men skriver aldrig så jag har hitills låtit bli att regga mig där.
Postad 11 April 2008 - 10:31
Bra idé, nån som redan är medlem där kanske kan skriva en fråga ?
Själv hänger jag där en del och läser, men skriver aldrig så jag har hitills låtit bli att regga mig där.
Äsch, vad tusan, jag hänger där så pass mycket i alla fall, så jag reggade mig nu och skrev en fråga.
http://www.hydrogena...showtopic=62580
Hoppas att de tycker det är värt tiden att få stopp på gnabbandet i detta ämne
Postad 11 April 2008 - 11:44
Antar att det var mig du syftade på. Då får du äran att förklara för mig varför FLAC skulle använda metoder att ta bort bitar efter den psykoakustiska modellen och intensiteter, sedan lägga på ditherbrus. Varför skulle FLAC kodningen använda sig av den psykoakustiska modellen med frekvensvariatorer, kvantisering, kodning och brus kontroll/distorsion loopar?Dessutom - för de som "inte tror att flac skulle bry sig om att hålla på med sådant": komprimera en wav-fil med winrar och samam fil med flac. Flac-filen blir mindre, för den "håller på med sådant".
macmic får väldigt gärna också svara.
Postad 11 April 2008 - 13:43
Antar att det var mig du syftade på. Då får du äran att förklara för mig varför FLAC skulle använda metoder att ta bort bitar efter den psykoakustiska modellen och intensiteter, sedan lägga på ditherbrus. Varför skulle FLAC kodningen använda sig av den psykoakustiska modellen med frekvensvariatorer, kvantisering, kodning och brus kontroll/distorsion loopar?
macmic får väldigt gärna också svara.
Hmmm, sa tidigare att jag inte vill bli kallad för trög, men nu måste jag erkänna att jag känner mig lite just så...
Om frågan är om FLAC "använder metoder att ta bort bitar efter den psykoakustiska modellen och intensiteter, sedan lägga på ditherbrus" så är mitt svar nej, i alla fall inte så som jag ser på det.
Som jag ser det så tar FLAC den ingående signalen, bryter ner den i passande block och lägger sedan dessa block i en ström av data som man sedan kör in i ett antal olika steg, först provar man det enkla 'Interchannel Decorrelation', sen kör man in det i 'prediction-steget', detta är i själva verket minst fyra diskreta steg, verbatim, constant och sedan två former av prediktion, 'fixed linear' och 'FIR linear'. Efter allt detta så kör man in strömmen (som nu har vissa block kodade av något av de föregående stegen och andra block är fortfarande okodade, d.v.s. sådant som man kunde inte komprimera med någon av de föregående teknikerna, så dessa block av insignal är kvar i sitt original-format, inte bortplockade), i det som kallas residual coding, där man med Rice/Golomb komprimerar så gott det går.
Så enligt mig så "håller man inte på med sådant", om det nu var så du menade
Om det var något annat du menade så ber jag redan nu om ursäkt för att jag är lite trög
Postad 11 April 2008 - 14:50
Postad 11 April 2008 - 20:41
...förklara för mig varför FLAC skulle använda metoder att ta bort bitar efter den psykoakustiska modellen och intensiteter, sedan lägga på ditherbrus. Varför skulle FLAC kodningen använda sig av den psykoakustiska modellen med frekvensvariatorer, kvantisering, kodning och brus kontroll/distorsion loopar?
Lossy koding betyder inte nödvändigtvis att psykoakustisk kodning används. Det är däremot en vanlig metod som
används av de flesta lossy-codecs som MP3, OGG Vobris, AAC osv.
Att koda "enligt den psykoakustiska modellen" som du skriver, behöver inte alls innebära några stora problem vid
lossless kodning. Det går att komma väldigt nära den ursprungliga ljudsignalen, och därmed behövs inte så mycket
korrigering. Exemplen nedan är från en ny pop-skiva, dvs komprimerad dynamik som är extra svår att koda.
Graferna beskriver skillnaden mellan originalet och den kodade filen.
OGG Vorbis @ Quality 98 (~457kbit/s):
wav_vs_ogg500.gif 14.82K
1 Antal nerladdningarMP3 @ VBR 100 (~225kbit/s):
wav_vs_mp3_vbr100.gif 18.75K
1 Antal nerladdningarMP3 @ 128kbit/s CBR:
wav_vs_mp3128.gif 23.22K
0 Antal nerladdningar
Redigerat av Ageve, 11 April 2008 - 20:42.
Postad 11 April 2008 - 21:14
Lossy koding betyder inte nödvändigtvis att psykoakustisk kodning används. Det är däremot en vanlig metod som
används av de flesta lossy-codecs som MP3, OGG Vobris, AAC osv.
Stämmer bra, även WMA och ATRAC kan nämnas som exempel på detta.
En fråga bara för att jag ska förstå dina grafer bättre, är det originalsignalen längst ner ?
Postad 11 April 2008 - 21:46
En fråga bara för att jag ska förstå dina grafer bättre, är det originalsignalen längst ner ?
Nej, alla visar skillnaden, dvs hur mycket den komprimerade ljuddatan skiljer sig från den ursprungliga ljuddatan.
Skillnaden blir mindre på mer dynamiskt (dvs mindre dynamikbegränsat) material. På klippet jag testade med låg
nivån nära max hela tiden, som på de flesta skivor nuförtiden.
Graferna visar däremot inte hur mycket hörbar skillnad det är, bara hur mycket det skiljer från originalet.
Skillnaden får man enkelt fram genom att öppna båda filerna och köra en inverterad "mix paste" i Cooledit/Adobe
Audition. Det enda man behöver tänka på är att klippa till båda filerna så att de börjar på samma sample, annars
blir resultatet åt pepparn.
Redigerat av Ageve, 11 April 2008 - 21:49.
Postad 11 April 2008 - 23:36
Postad 12 April 2008 - 09:01
macmic, menar du att ingen information går förlorad i steget att man använder (t.ex.) linjär prediktion, att det bara är ett sätt för att trolla bort korrelationerna i signalen (man ersätter signalen med en känd modell + residualer) så att residualerna, som får en bättre fördelning för att packas effektivt med Rice? Eller hur vill du ha det? Kan du göra ett räkneexempel så vore det uppskattat. (Skulle gärna hacka lite i matlab om jag förstod exakt hur det gick till.)
Jag menar att ingen information går förlorad för att det är en ström av block där man i alla steg (t.ex. ett av prediktionsstegen) bara kodar de block man kan (som är lönsamt ur kompressionshänseende) med den aktuella algoritmen. Så eftersom vissa block kommer att vara kodade med t.ex. linjär prediktion, andra block kommer att vara kodade på andra sätt och ytterligare andra block kommer att vara helt okodade (=original) så provar man med Rice/Golomb lite som 'en sista utväg', det är inte särskilt effektivt, men det är ganska lätt och några bytes här och där går det att skrapa ihop med detta i alla fall...
Jag ser det hela mer som ett programmeringsproblem snarare än en enskild ekvation som måste gå att lösa på matematisk väg, i programmet kan man ju 'fuska' och välja vilka bitar man räknar ut på ett sätt och vilka bitar man ska räkna ut på ett annat sätt, det är precis det man utnuttjar i flac och många andra komprimeringsprogram.
Om du vill se exakt hur det går till när de räknar på det är det nog allra lättast att du checkar ut källkoden ur deras CVS och kollar där, 'use the force, read the source' som någon sa...
Postad 12 April 2008 - 11:42
Jo, var bara det med ditherbruset jag var lite osäker på om man kunde återställa med korrigering.Lossy koding betyder inte nödvändigtvis att psykoakustisk kodning används. Det är däremot en vanlig metod som
används av de flesta lossy-codecs som MP3, OGG Vobris, AAC osv.
Att koda "enligt den psykoakustiska modellen" som du skriver, behöver inte alls innebära några stora problem vid
lossless kodning. Det går att komma väldigt nära den ursprungliga ljudsignalen, och därmed behövs inte så mycket
korrigering. Exemplen nedan är från en ny pop-skiva, dvs komprimerad dynamik som är extra svår att koda.
Redigerat av Isaac, 12 April 2008 - 11:43.
1 användare läser detta ämne
0 medlemmar, 1 gäster, 0 anonyma medlemmar
Sökningen pågår
Avancerad sökning
13 bilder
4 filmer
Minhembio - Senaste nyheterna






Fler
Vilka bilder visas här?