Разговор:MP3

Из пројекта Википедија

MP3(MPEG-1 Audio Layer 3) – Zvučni format



MPEG-1 Audio Layer 3, obično nazivan MP3, je popularan digitalni zvučni lossy kompresovani format, napravljen da značajno umanji količinu podataka potrebnih da stvore zvuk, ali da i dalje zvuče kao originalni nekompresovani zvuk za većinu slušaoca. Lossy je metod kompresovanja podataka u kome kompresovanjem i zatim dekompresovanjem podataka dobijamo podatke koji su razliciti od originala ali su “dovoljno slični” da budu korisni, međutim svaki put kada se informacija kompresuje, deo je izgubljen i ne može se vratiti. MP3 je izumio tim Njemačkih inžinjera, koji je radio u odsjeku EUREKA 147 projekta, koji se bavio izučavanjem tehnologije za odašiljanje audio signala korištenjem digitalnog radio odašiljanja, takodje poznat kao Digital Audio Broadcast ili DAB. Postao je ICO(International Electrotechnical Commission) standard 1991.

MP3 je specifičan zvučni kompresovani format, u kome dobijamo PCM(Pulse-code modulation) zvuk u mnogo manje prostora(memorije) nego što bismo dobijali običnim metodama. To se postiže korišćenjem psihoakustičnih modela, da bi se izbacile sve komponente zvuka koje ljudsko uho slabo ili uopšte ne čuje, i zatim snimanjem ostatka zvuka na veoma efikasan način. Sličan princip se koristi pri stvaranju JPEG-a, kompresovanog lossy formata slike. PCM ili modulacija pulsnog koda je digitalno predstavljanje analognog signala, gdje se najveći dio signala, redovno, u stalnim intervalima, mjenja iz stalnih(konstantnih) signala u sporadične(diskretne) signale, i zatim se od niza sporadičnih signala stvara niz simbola u digitalnom(obično binarnom) kodu. PCM je korištena u telefonskim sistemima, i standardna je za digitalan zvuk u računarima i kompakt diskovima.

MP3 zvuk može biti kompresovan sa različitim bit rate-om(broj bita obrađen u jedinici vremena), što pruža dosta varijacija između veličine i kvaliteta zvučnog zapisa. MPEG(Moving Picture Experts Group) je radna grupa koja razvija video i audio tehnološke standarde. MPEG podržava upotrebu AAC(Advanced Audio Coding)-a nastalog iz MPEG-4, kao nasljednika MP3-a, iako su noviji audio formati dostigli slične nivoe upotrebe. Međutim, ekstremna popurnost MP3 formata mu osigurava, dominantnu poziciju medju zvučnim formatima u bliskoj budućnosti, najviše zbog podrške raznih hardverskih i softverskih rešenja, uključujući prenosne MP3 player-e, pa čak i neke DVD i CD player-e. Velike MP3 kolekcije koje su mnogi pojednici sakupili, su MP3 formatu osigurali trajnost, na isti način na koji to čini bilo koji fizički medijum.

AAC je standardizovan, digitalni zvučni lossy kompresovani format, sličan MP3-ju. Međutim, AAC ima bolji kvalitet zvuka na istom nivou kompresovanja nego MP3, ili manju veličinu fajla za isti kvalitet zvuka. Na primjer: Pjesma od 192 kpbs(kilobita po sekundi) kompresovana u MP3 formatu, će biti istog kvaliteta kao i pjesma od 128 kpbs u AAC formatu, koja će biti manja, tj. zauzimaće manje memorije. AAC format je najčešće korišćen kao standardni format za pokretni muzički player iPod, i media player aplikaciju iTunes, kompanije Apple. Istorija formata


Razvoj

Kodiranje je proces pretvaranja informacije iz jednog formata u drugi format. Kodiranje MPEG-1 Audio Layer-a 2(MP2) je počelo kao dio DAB projekta pod vođstvom Egon Meier-Engelen-a iz Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt-a(kasnije poznat kao Deutsches Zentrum für Luft- und Raumfahrt, tj. Njemački Vazduhoplovni Centar) iz Njemačke. Projekat je finansiran od strane Evropske Unije, kao dio EUREKA istraživačkog projekta, koji je obično poznat kao EU-147. EU-147 je trajao od 1987 do 1994 godine.

1991-e godine, postojala su dva prijedloga: Musicam(poznat kao Layer-2), i ASPEC(Adaptive Spectral Perceptual Entropy Coding). Musicam tehnika, koju su predložili Philips(Holandija), CCETT(Francuska) i Institut für Rundfunktechnik(Njemačka), je izabran zbog njegove jednostavnosti i rijetkih grešaka, ali i zbog male količine energije koja je potrebna za kodiranje visoko kvalitetnog kompresovanog zvuka. Musicam format, zasnovan na sub-band kodiranju(kodiranje gdje se dijelovi signala koje uho ne detektuje brišu), je bio ključan za stvaranje osnova MPEG zvučnog kompresovanog formata, kao što su: sampling rate - učestalost obrade uzoraka signala, strukture dijelova signala(frame-ova) i broj uzoraka u dijelu signala(samples per frame). Njegova tehnologija i ideje su u potpunosti upotrebljene u stvaranju ISO MPEG Audio Layer 1 i Layer 2, te kasnije i Layer 3 formata, tj. MP3 formata. Pod vodjstvom profesora Mussmanna(sa Univerziteta u Hanoveru), je stvoren ISO standard za novonastali audio format MP3.

Radna grupa sastavljena od Leona van de Kerkhofa(Holandija), Gerharda Stolla(Njemačka), Leonarda Chiariglionea(Italija), Yves-François Deherya(Francuska) i Karlheinza Brandenburga(Njemačka) je uzela ideje iz od Musicam-a i ACPEC-a, zatim dodala par svojih i stvorila MP3, koji je bio dizajniran da ima isti kvalitet na 128 kbps, kao što to ima MP2 na 192 kbps.

Svi algoritmi su odobreni 1991. godine, a završeni 1992. godine, kao dio MPEG-a 1, prvog standardnog MPEG formata ikad stvorenog, koji je rezultirao objavljivanjem internacionalnog standarda ISO 11172-3, 1993. godine. Dalji rad na MPEG audio formatu je završen 1994. godine kao drugi dio MPEG standardnog formata, MPEG-a 2, formalno poznat kao ISO standard 13818-3, objavljen 1995. godine.

Efikasnost kompresovanja kodera je obično određena bit rate-om, zbog toga što brzina kompresije zavisi od “dubine” bita i učestalosti obrade ulaznog signala. Bez obzira na to, često se koriste brzine kompresije koje koriste parametre CD-a kao polazne(44.1 kHz, 2 kanala po 16 bita ili 2x16 bit). Ponekad se parametri Digitalne Audio Trake(DAT), koriste kao polazni(48 kHz, 2x16 bit), zbog toga što je brzina kompresije kod DAT-a, nešto brža.

Karlheinz Brandenburg je koristio CD snimak pjesme “Tom’s Diner” pjevačice Suzanne Vega da procjeni koliko se zvuka zaista gubi prilikom kompresije. Odabrao je ovu pjesmu zbog njene “mekoće” i jednostavnosti, da bi mogao lakše da uoči nesavršenosti u kompresovanom formatu prilikom slušanja pjesme. Pojedinci su kroz šalu izjavili da je Suzanne Vega “Majka MP3-a”. Neki malo ozbiljniji i složeniji instrumenti kao što su ksilofon, triangl i harmonika, su uzeti sa EBU V3/SQAM kompakt diska, koji je služio mnogim profesionalnim zvučnim inžinjerima kao osnova za procjenu subjektivnog kvaliteta MPEG formata.

Izlazak u javnost

Osnovno softversko rešenje, napisano u C programskom jeziku i poznato kao ISO 11172-5, je razvijeno od strane članova ISO MPEG Audio komisije u cilju proizvodnje MPEG Audio fajlova(Layer 1, Layer 2, Layer 3). Radeći u ne-realnom vremenu na različitim operativnim sistemima, bili su u mogućnosti da demonstriraju prvo hardversko rešenje u realnom vremenu koje je u mogućnosti da dekodira kompresovani zvuk. Neke druge upotrebe MPEG Audio kodera u realnom vremenu su moguće u svrhu odašiljanja prema potrošačima, kao što su radio DAB i televizijski programi DVB.

Kasnije, 7 jula 1994. godine Fraunhofersko Društvo je izdalo prvo softversko rešenje za kodiranje MP3 fajlova nazvano L3enc. Ekstenzija fajla .mp3 je izabrana od strane Fraunhoferskog tima, 14 jula 1995. godine(fajlovi su prethodno imali ekstenziju .bit). Sa prvim MP3 playerom Winplay3, izdatog 9 septembra 1995. godine, mnoge osobe su mogli da dekodiraju i stoga da koriste MP3 fajlove na računarima. Zbog relativno malih hard diskova u to vrijeme(oko 500 MB), ta tehnologija je postala ključna za čuvanje instrumentalne muzike za korišćenje na računarima.

MP2

U oktobru 1993. godine, MP2(MPEG-1 Audio Layer 2) fajlovi se pojavljuju na Internetu i počinju da se često koriste korištenjem Xing MPEG Audio Playera i kasnije u programu za Unix operativni sistem, nazvanom MAPlay, tvorca Tobiasa Badinga, prvobitno objavljenom 12 februara 1994. godine(MAPlay je takođe kasnije portovan i na Microsoft Windows).

U početku jedini dostupan koder za stvaranje MP2 fajlova je bio Xing koder, propraćen programom CDDA2WAV, koji je transformisao CD pjesme u Waveform audio fajlove.

Internet Underground Music Archive(IUMA) je obično prihvaćen kao pionir muzičke revolucije. IUMA je bio prvi muzički web sajt na Internetu, koji je sadržao hiljade MP2 snimaka pre nego što je MP3 postao popularan.

Internet

U prvoj polovini 1995. godine tokom kasnih 90-tih godina prošlog vijeka, počeo je procvat MP3 fajlova na Internetu. MP3 duguje svoju popularnost uspjehu kompanija i softverskih rešenja kao što su Nullsoft - ov Winamp(izdat 1997. godine), mpg123(za UNIX) i NAPSTER-a(izdat 1999. godine). Ti programi i online muzički servisi, su omogućili prosečnom korisniku da sluša, stvara, dijeli ili sakuplja MP3 fajlove.

Peer to Peer(terminal do terminala) dijeljenje Mp3 fajlova je izazvalo mnogobrojne kontroverze u poslednje vreme – uglavnom zbog visokog nivoa kompresije koji rezultuje “malim” muzičkim fajlovima, koji se zbog toga lako dijele i razmenjuju među korisnicima. U suprotnom fajlovi bi jednostavno bili preveliki za dijeljenje. Neke veće muzičke produkcijske kuće su reagovale tako što su podnele tužbu protiv NAPSTERA(web-site za dijeljenje muzike), zbog široke rasprostranjenosti MP3 fajlova na Internetu koje je dotični sajt besplatno distribuirao i time povredio autorska prava određenih muzičkih produkcijskih kuća, da bi tako zaštitili svoja autorska prava.

Komercijalni online muzički servisi(trgovine), kao što je iTunes Store, obično preferiraju druge, prikladnije, muzičke formate koji podržavaju Digital Rights Management ili DRM(digitalna autorska prava), da bi mogli lakše da ograniče upotrebu digitalne muzike. Korišćenje formata koji podržavaju DRM, je pokušaj da se spriječi povreda autorskih prava zaštićenih materijala, ali postoje metode protiv većine planova za zaštitu, mada su takve metode ilegalne u mnogo zemalja.

Kodiranje MP3 fajlova

Prilikom postavljanja standarda za MPEG-1, nije precizno određeno kakav koderi mora ju biti. Nasuprot njima, algoritmi za dekodiranje i formati fajlova su precizno definisani. Predviđeno je da korisnici standarda sami stvore svoje algoritme prikladne za uklanjanje dijelova informacije iz sirovog zvuka. Tokom kodiranja 576 vremenskih signala se transformiše u 576 frekvencionalnih signala. U slučaju tranzietnog signala(signala kratkog trajanja, neharmonijske osnove i većih frekvencija nego što to ima normalan harmonijski signal) koristi se 192 uzoraka signala umjesto 576. Ovo se čini da bi se ograničilo vremensko širenje količine buke koja prati tranzietni signal.

Ovo je oblast psihoakustike – nauke koja proučava subjektivnu percepciju zvuka kod ljudskih bića.

Rezultat toga je veliki broj MP3 kodera, od kojih svaki proizvodi fajlove različitog kvaliteta. Programi za poređenje kvaliteta kodera su lako dostupni, stoga je lako korisnicima da odaberu najbolji koder. Treba imati na umu, da dok je koder efikasan u kodiranju MP3 fajlova sa višim bitrate - om(kao što je to slučaj sa LAME koderom, koji je u širokoj upotrebi pri kodiranju fajlova sa višim bitrate - ovima), on ne mora biti efikasan pri kodiranju fajlova sa nižim bitrate – om.

Dekodiranje MP3 fajlova

Dekodiranje, s druge strane, je specifično definisano. Većina dekodera se slaže prilikom dekodiranja nizova bita, što znači da će dekompresovani izlazni signal koji proizvode, biti isti(sa različitim nivoom zaokruživanja) kao što je i izlazni signal definisan matematički u ISO dokumentu o standardu MP3 fajlova. Kostur MP3 fajla se sastoji od 384, 576 ili 1152 uzoraka signala(u zavisnosti od verzije MPEG layera) i svi dijelovi kostura su povezani sa dodatnim podatkom na početku, od 32 bita, i sa sporednim informacijama(rebrima) od 9, 17, ili 32 bita(u zavisnosti od verzije MPEG-a i od toga da li je signal stereo ili mono). Dodatni podatak na početku ili HEADER, i sporedne informacije(rebra), pomažu dekoderu da dekodira podatke na ispravan način.

Stoga, poređenja dekodera je su većini slučajeva bazirana na tome koliko su računarski efikasni, tj. da koliko memorije ili procesora koriste prilikom dekodiranja.

Bit rate

Bit rate je broj bita koji se obradi u jedninici vremena, obično u sekundi. Kod MP3 fajlova, bit rate može biti različit. Opšte pravilo je da se pri većem bit rate-u, gubi manje originalnog zvuka, i stoga je fajl većeg kvaliteta. U ranim danima MP3 fajlova bit rate je bio fiksna vrijednost.

Bit rate kod MP3(MPEG-1 Layer 3) fajlova može biti: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 i 320 kbit/s; pri frekvencijama od 32, 44.1 i 48 kHz. 44.1 kHz se skoro uvek koristi, dok je bit rate od 128 kbit/s postao “dovoljno dobar” standard, iako bit rate od 192 kbit/s ubrzano postaje sve popuraniji među korisnicima peer-to-peer programa. MPEG-2 i nezvanični MPEG 2.5 uključuju neke dodatne bit rate-ove: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s; pri nešto nižim frekvencijama: 8, 11.025, 12, 16, 22.05 i 24 kHz. Odnos između bit rate-a i kvaliteta kod MP3 fajlova: • 32 kbit/s —AM radio kvalitet • 96 kbit/s — FM radio kvalitet • 128 - 160 kbit/s – Pristojan kvalitet, razlika između originala i MP3 fajla ponekad može biti očigledna • 192 kbit/s — Dobar kvalitet, razliku moze uočiti samo nekolicina pojedinaca • 224 - 320 kbit/s — Veoma dobar kvalitet, skoro bez ikakve razlike

Varijabilan bit rate(VBR), je takođe moguć. Zvuk u fajlu se dijeli na dijelove od kojih svaki ima svoj bit rate, tako da je moguće da se bit rate dinamično mjenja tokom dekodiranja. Ova tehnika omogućava upotrebu većeg broja bita za dijelove zvuka koji su dinamičniji i manje bita za dijelove koji su manje dinamični, povećavajući kvalitet i smanjujući veličinu fajla. Na primjer, dionica zvuka sačinjena od jednostavnih tonova može biti kodirana na 48 kbit/s, zauzimajući manje prostora, bez ikakve primjetne razlike u kvalitetu, dok se dionica zvuka koju izvodi simfonijski orkestar kodira na 224 kbit/s da bi ta dionica bila što vjernija originalu. Iako nije originalno predviđeno, mnogi koderi koriste ovu tehniku u manjoj ili većoj mjeri.

Nestandardni bit rate-ovi sve do 640 kbit/s mogu biti postignuti sa LAME koderom i njegovom freeformat opcijom, ali nekolicina MP3 playera podržava takve fajlove. Gabriel Bouvigne, jedan od osnivača LAME projekta, je izjavio sledeće o freeformat opciji: “Freeformat je u skladu sa MP3 standardom. Dekoderi su obavezni da budu u mogućnosti da dekodiraju fajlove do 320 kbit/s, ali dekodiranje fajlova sa višim bit rate-om od 320 kbit/s nije obavezno. Praktično, to znači da ako je fajl kodiran sa bit rate-om višim od 320 kbit/s, samo ga nekolicina dekodera podržava.”



Kvalitet zvuka

Zbog toga što je MP3 lossy format, on je u mogućnosti da ponudi različit bite rate tj. broj bita kodiranih podataka koji se koriste da predstave svaki sekund zvuka. Obično se koriste bit rate-ovi između 128 i 320 kilobita po sekundi. Kao suprotnost, nekompresovan zvuk na kompakt disku ima bit rate od 1411.2 kbit/s(16 bita po uzorku x 44100 uzoraka po sekundi x 2 kanala).

MP3 fajlovi kodirani sa manjim bit rate-om obično će biti manjeg kvaliteta, tj. zvučaće lošije. Sa preniskim bit rate-om zvukovi koji nisu postojali u originalnom snimku, mogu se čuti prilikom reprodukcije. Ti zvukovi se nazivaju kompresioni artefakti(compression artifacts) ili KA. Dobar primjer za kompresione artefakte je zvuk aplauza – težak je za kodiranje zbog nasumičnosti i oštrine svakog zvuka, stoga se KA mogu čuti u obliku zvonjave i pre-eha.

Pored bit rate-a kodiranog fajla, kvalitet MP3 fajlova zavisi od kvaliteta kodera i komplikovanosti signala koji se kodira. Pošto MP3 standard dozvoljava dosta slobode prilikom kodiranja fajlova, različiti koderi mogu stvarati fajlove različitog kvaliteta, čak i pri približno istim bit rate-ovima. Na primjer, jedno javno ispitivanje o dva MP3 kodera na oko 128 kbit/s, je došlo do sledećih rezultata: jedan koder je dobio ocjenu 3.66 na skali od 1 do 5, dok je drugi dobio samo 2.22.

Kvalitet je visoko zavisan od izbora kodera i kodirajućih parametara. Dok je kvalitet od oko 128 kbp/s neprijatan i jedva prihvatljiv kod starijih kodera, moderniji MP3 koderi daju veoma dobar kvalitet pri tim bit rate-ovima, sudeći po istraživanjima sprovedenim u januaru 2006. godine, koji se statistički ne razlikuje od kvaliteta koji pruža AAC, tehnički nasljednik MP3 fajlova. Međutim, 1998. godine, MP3 na 128 kbp/s je pružao kvalitet ekvivalentan kvalitetu AAC fajla na 96 kbp/s i MP2 na 192 kbp/s. Transparentnost je idealan rezultat lossy kompresije podataka. Ako je kompresovan zvuk perceptivno nemoguće razlikovati od nekompresovanog originala onda se kompresija može smatrati transparentnom. Drugim riječima, transparentnost je situacija gdje kompresioni artefakti ne postoje ili su u potpunosti neprimjetni. Prag transparentnosti MP3 fajlova se može procjeniti na oko 128 kbp/s sa dobrim koderom na normalnom zvuku, međutim neki komplikovaniji dijelovi zvuka mogu zahtjevati kodiranje na 192 kbp/s ili više. Kao i kod svih lossy formata, neki zvuci ne mogu biti savršeno transparentni za sve korisnike.

Pri niskim bit rate-ovima ispod 96 kbp/s, kvalitet MP3 fajlova rapidno opada i daleko je iza AAC fajlova na 32 kbp/s, kao što je pokazalo javno istraživanje u junu 2006. godine.

Takođe je važno primjetiti da na percepcijalni kvalitet može uticati ambijent slušaoca, kao i njegova pažnja i istančanost sluha.

Struktura fajla

MP3 fajl je sastavljen od višestrukih MP3 frame-ova, koji se sastoje od MP3 header-a i MP3 podataka. Ovakva sekvenca frame-ova se naziva elementarni niz. Frame-ovi su nezavisni dijelovi – moguće je “isjeći” frame iz fajla i MP3 player ga može reprodukovati. MP3 podaci su u stvari zvučni zapis.

MP3 header se sastoji od tzv. sinhrone riječi, Syncword, koja se koristi da označi početak validnog frame-a. Poslije Syncword slijedi bit koji pokazuje da je to MPEG standard i dva bita koja označavaju da se koristi Layer 3, stoga MPEG-1 Audio Layer 3 ili MP3. Poslije ovog, vriijednosti se razlikuju od jednog MP3 fajla do drugog. Opsjeg vrijednosti za svaki dio headera zajedno sa njegovim specifikacijama je definisan ISO 11172-3 standardom.

Većina MP3 fajlova danas sadrži ID3 metapodatke(metadata), koji prethodi ili prati MP3 frame-ove.

ID3 i drugi “tagovi”

Dodatak, tzv. TAG, u kompresovanom audio fajlu je dio fajla koji sadrži metapodatke kao što su ime pjesme, izvođač, ime albuma, broj pjesme ili neke druge informacije o sadržaju fajla. Metapodaci su, najjednostavnije rečeno, podaci o podacima.

Od 2006. godine najrasprostranjeniji tagovi si ID3v1 i ID3v2, i skorašnji APEv2.

ID3v1 je kontejner metapodataka sastavljen sa MP3 audio formatom. ID3v1 je kreirao Erik Kemp 1996. godine i on je ubrzo postao standardan za skladištenje metapodataka u MP3 fajlovima. ID3v1 tag zauzima 128 bajta, i počinje sa stringom TAG. Da bi bio kompatibilan i sa starijim media playerima, tag je postavljen na kraj fajla. Neki playeri prilikom reprodukcije fajla emituju statični šum, i većina korisnika je ignorisala tu pojavu, dok većina modernih media playera uspešno eliminiše ovu pojavu. Michael Mutschler je 1997. godine proširio ID3v1, koristeći poslednji bajt malo korištenog polja za komentare, da sačuva redni broj pjesme. Takvi tagovi se nazivaju ID3v1.1.

Međutim, mala veličina taga je dozvoljavala samo 30 bajta za naslov, izvođača, album i komentar, 4 bajta za godinu, i jedan bajt da identifikuje žanr pjesme sa liste od 80 vrijednosti(Winamp je kasnije proširio listu na 148 vrijednosti). Dugačka imena pjesama ili albuma su jednostavno morala biti “isječena” i skraćena.

Mnogi su kritikovali predefinisanu listu žanrova koji nisu sadržali uobičajene žanrove kao Minimalist ili Barok, ali su sadržali žanrove kao Hrišćanski rep.

ID3v1 takođe nije bio internacionalan, tj. nije bio prilagođen drugim zemljama. Dok je nominalno tekst trebao da bude kodiran u ISO-8859-1 koji je predviđen za engleski alfabet, u praksi se obično koriste lokalni načini kodiranja koji se razlikuju od zemlje do zemlje, stoga je pojava mojibake-a uobičajena u ID3v1 tagovima.

Mojibake je fenomen pojave netačnih, nečitkih karaktera, prikazanih kada kompjuterski softver ne uspe da tačno ispiše karaktere.

U odgovoru na ovakve kritike, stvoren je ID3v2. Iako nosi ime ID3 ima vrlo malo veze sa ID3v1 tagom.

ID3v2 tagovi su promjenjive veličine, i obično se nalaze na početku fajla. Sastoje se od nekoliko frame.ova, od kojih svaki sadrži dio metapodataka. Tekstualni frame-ovi su označeni sa kodirajućim bitom, iako je pojava mojibake-a i dalje česta.

U najnovijem ID3v2 postoje 84 tipa frame-a i aplikacije takođe mogu definisati svoje tipove. Postoje standardni frame-ovi koji sadrže slike naslovne strane albuma, bita po minuti(BMP) koji označava tempo pjesme, autorska prava, licencu, stihove kao i ostale stvari.

Postoje verzije v2.2, v2.3, i v2.4.

APEv2 je originalno namjenjen za Musepack(MPC) format. APEv2 može postojati zajedno sa ID3 tagovima u istom fajlu, a takođe može postojati i individualno.

Opcije za uređivanje tagova se često nalaze integrisane u MP3 playere, ali takođe postoje tag editori, koji su napravljeni u tu svrhu.


Normalizacija jačine zvuka

Budući da se kompakt diskovi i drugi razni izvori zvuka snimaju sa različitim jačinama zvuka, korisno je sačuvati informacije o jačini zvuka u fajlu, tako da se prilikom repordukcije jačina zvuka može dinamički podešavati.

Predloženo je nekoliko standarda za kodiranje jačine zvuka kod MP3 fajlova. Ideja je sledeća – normalizacija prosječne jačine zvuka audio fajlova, tako da se jačina ne mjenja od jedne pjesme do druge.

Najpopularnije i rješenje koje je u najširoj upotrebi za određivanja jačine zvuka je poznato kao “Replay Gain”. Obično, prosječna jačina zvuka i dodatne informacije o fajlu su sačuvane u tagu.

Ograničenja formata

Postoji nekoliko ograničenja MP3 formata koja ne mogu biti prevaziđena korištenjem boljeg kodera. Noviji zvučni formati nemaju takva ograničenja.

U tehničkom smislu, MP3 je ograničen na sledeće načine:

• Bit rate je ograničen na maksimum od 320 kbps(dok neki koderi mogu stvoriti fajlove sa većim bit rate-ovima, postoji malo ili ni malo softverske podrške za visoke bit rate-ove) • Postojanje tranzietnih signala koji se ne slažu sa realnim vremenom, tako da može da dođe do “razvlačenja” zvuka • Zajednički stereo zvuk se dobija frame po frame • Koder ili dekoder nemaju definisan tačan vremenski period trajanja pauza između 2 pjesme, što stvara problem predugačkih pauza ili preklapanja zvukova jedne sa zvukovima druge pjesme. Međutim, neki koderi, kao LAME, mogu dodati dodatne metapodatke koji dozvoljava MP3 playeru da stvara trenutni prelaz između 2 pjesme • Efikasnost kodiranja se smanjuje zbog ograničene rezolucije frekvencije

Na kraju, bez obzira na ova ograničenja, MP3 koderi i dekoderi mogu biti i jesu veoma kompetativni na tržištu.