उत्कृष्ट ऑडिओ मिथक: आपल्याला त्या 32-बीट डीएसीची आवश्यकता का नाही

लेखक: Randy Alexander
निर्मितीची तारीख: 1 एप्रिल 2021
अद्यतन तारीख: 1 जुलै 2024
Anonim
उत्कृष्ट ऑडिओ मिथक: आपल्याला त्या 32-बीट डीएसीची आवश्यकता का नाही - तंत्रज्ञान
उत्कृष्ट ऑडिओ मिथक: आपल्याला त्या 32-बीट डीएसीची आवश्यकता का नाही - तंत्रज्ञान

सामग्री


आपण कदाचित लक्षात घेतल्याप्रमाणे, आधुनिक फ्लॅगशिप स्मार्टफोनमध्ये "स्टुडिओ गुणवत्ता" ऑडिओ चिप्स समाविष्ट करण्याचा स्मार्टफोन उद्योगात एक नवीन ट्रेंड आहे. 192kHz ऑडिओ समर्थनासह 32-बिट डीएसी (डिजिटल ते एनालॉग कनव्हर्टर) विशिष्ट पत्रकावर नक्कीच चांगले दिसत आहे, परंतु आमच्या ऑडिओ संग्रहांचा आकार वाढवण्यामध्ये काही फायदा नाही.

ही थोडी खोली आणि नमुना दर अभिमान बाळगणे हे ऑडिओ उद्योगातील ग्राहक आणि कम्युनिकेशनच्या अभावाचा फायदा घेणार्‍या ऑडिओ इंडस्ट्रीची आणखी एक घटना आहे हे स्पष्ट करण्यासाठी मी येथे आहे. आपल्या गाढ्या टोपींचा मागोवा घ्या, आम्ही ऑडिओच्या इन आणि आउटस स्पष्ट करण्यासाठी आम्ही काही गंभीरपणे तांत्रिक बाबींमध्ये जात आहोत. आणि आशा आहे की आपण बहुतेक विपणन हायपर का दुर्लक्षित केले पाहिजे हे मी देखील आपल्यास सिद्ध करेन.

तुला ते ऐकायचं आहे का?

आम्ही त्यात जाण्यापूर्वी, हा पहिला विभाग डिजिटल ऑडिओ, बिट-खोली आणि नमुना दर या दोन मुख्य संकल्पनांवर काही आवश्यक पार्श्वभूमी माहिती प्रदान करतो.

नमुना दर संदर्भित करतो की आम्ही किती वेळा सिग्नलविषयी विशालता माहिती कॅप्चर किंवा पुनरुत्पादित करणार आहोत. मूलत :, एखाद्या विशिष्ट बिंदूवर त्याबद्दल अधिक जाणून घेण्यासाठी आम्ही एका वेव्हफॉर्मला बरेच लहान भागांमध्ये कापून टाकतो. Nyquist प्रमेय म्हणते की कॅप्चर करणे किंवा पुनरुत्पादित करणे शक्य असलेली सर्वाधिक संभाव्य वारंवारता नमुना दरापेक्षा अर्ध्या आहे. हे कल्पना करणे अगदी सोपे आहे, कारण आपल्याला वारंवारता अचूकपणे जाणून घेण्यासाठी वेव्हफॉर्मच्या वरच्या आणि खालच्या (ज्यासाठी दोन नमुने आवश्यक आहेत) च्या अवयवांची आवश्यकता आहे.


नमुना दर (शीर्ष) वाढविणे प्रति सेकंद अतिरिक्त नमुन्यांचा परिणाम देते, तर मोठा बिट-डेप्थ (तळाशी) येथे नमुना रेकॉर्ड करण्यासाठी अधिक संभाव्य मूल्ये प्रदान करतो.

ऑडिओसाठी, आम्ही फक्त आम्ही काय ऐकू शकतो याविषयी संबंधित आहोत आणि लोकांची बहुतेक सुनावणी 20kHz च्या आधी बंद होते. आता आम्हाला नायक्विस्ट प्रमेय बद्दल माहित आहे, आम्हाला हे समजले आहे की frequency 44.१ केएचझेड आणि k 48 केएचझेड सामान्य नमुन्यांची वारंवारता का आहेत, कारण आम्ही ऐकू शकणा maximum्या जास्तीत जास्त वारंवारतेपेक्षा ती जास्त आहेत. स्टुडिओ गुणवत्ता 96 केएचझेड आणि 192 केएचझेड मानकांचा अवलंब केल्याने उच्च वारंवारतेचा डेटा मिळविण्याशी काही संबंध नाही, ते निरर्थक ठरेल. परंतु आम्ही एका मिनिटात त्यामध्ये जास्त डुंबू.

जसे आपण कालांतराने मोठेपणाकडे पहात आहोत, तितके मोठेपणा हे मोठेपणा डेटा संचयित करण्यासाठी उपलब्ध ठराव किंवा उपलब्ध बिंदूंची संख्या संदर्भित करते. उदाहरणार्थ, 8-बिट आम्हाला 256 भिन्न गुणांची पूर्तता करतात, 16-बिट परिणाम 65,534 गुणांमध्ये आणि 32-बिट मूल्य डेटा आम्हाला 4,294,967,294 डेटा पॉइंट्स देतात. हे स्पष्ट असले तरी, यामुळे कोणत्याही फाइल्सचा आकार मोठ्या प्रमाणात वाढतो.


विशालतेच्या अचूकतेच्या बाबतीत थोडी खोलीबद्दल त्वरित विचार करणे कदाचित सोपे असेल, परंतु येथे समजून घेण्याच्या अधिक महत्त्वाच्या संकल्पना म्हणजे आवाज आणि विकृती. अगदी कमी रिझोल्यूशनसह, आम्ही कदाचित कमी मोठेपणाची माहिती गमावू किंवा चुकीच्या आणि विकृतीच्या (परिमाण त्रुटी) परिचय देणार्‍या वेव्हफॉर्मच्या शिखरावर कापून टाकू. विशेष म्हणजे, आपण कमी रिझोल्यूशन फाईल परत पाठविल्यास हे बर्‍याच वेळा आवाजासारखे वाटेल, कारण आम्ही कॅप्चर केले जाऊ शकते आणि पुनरुत्पादित करू शकणार्‍या सर्वात लहान संभाव्य सिग्नलचा आकार प्रभावीपणे वाढविला आहे. आमच्या वेव्हफॉर्ममध्ये आवाजाचे स्रोत जोडण्यासारखे हेच आहे. दुस words्या शब्दांत, बिट-खोली कमी केल्याने आवाज मजला देखील कमी होतो. बायनरी नमुन्याच्या बाबतीत याचा विचार करण्यास देखील मदत होऊ शकते, जेथे कमीतकमी महत्त्वपूर्ण बिट आवाजच्या मजल्याचे प्रतिनिधित्व करते.

म्हणूनच, एक उच्च बिट खोली आपल्याला एक मोठा आवाज मजला देते परंतु वास्तविक जगात हे किती व्यावहारिक आहे याची मर्यादित मर्यादा आहे. दुर्दैवाने, सर्वत्र पार्श्वभूमीचा आवाज आहे आणि मी असा नाही की बस रस्त्यावरुन जात आहे. केबल्सपासून ते आपल्या हेडफोन्सपर्यंत, एम्पलीफायरमध्ये ट्रान्झिस्टर आणि अगदी आपल्या डोक्याच्या कानांपर्यंत, वास्तविक जगात ध्वनी प्रमाणचे जास्तीत जास्त सिग्नल सुमारे 124 डीबी असते, जे अंदाजे 21-बिट किमतीच्या डेटाचे कार्य करते.Jargon बस्टर:

डीएसी- डिजिटल-टू-एनालॉग कनव्हर्टर डिजिटल ऑडिओ डेटा घेते आणि हेडफोन्स किंवा स्पीकर्सवर पाठविण्यासाठी त्यास एनालॉग सिग्नलमध्ये रूपांतरित करते.

नमुना दर- हर्ट्झ (हर्ट्झ) मध्ये मोजले जाणारे, ही प्रत्येक सेकंदात घेतलेल्या डिजिटल डेटा नमुन्यांची संख्या आहे.

एसएनआर- सिग्नल-टू-आवाजाचे प्रमाण हे इच्छित सिग्नल आणि पार्श्वभूमी सिस्टमच्या आवाजामधील फरक आहे. डिजिटल सिस्टममध्ये याचा थेट संबंध बिट-डेथिंगशी केला जातो.

तुलनासाठी, कॅप्चरचे 16-बिट्स 96.33 डीबी च्या ध्वनी रेशो (सिग्नल आणि पार्श्वभूमी आवाज दरम्यान फरक) चे संकेत देतात, तर 24-बिट 144.49 डीबी ऑफर करतात, जे हार्डवेअर कॅप्चर आणि मानवी आकलनाची मर्यादा ओलांडतात. तर आपला 32-बिट डीएसी प्रत्यक्षात केवळ 21-बिट उपयुक्त डेटामध्ये आउटपुट करण्यात सक्षम असेल आणि इतर बिट सर्किट आवाजाद्वारे मुखवटा घातलेले असतील. प्रत्यक्षात जरी, बहुतेक इतर सर्किट घटक स्वतःचा आवाजाचा परिचय देतात म्हणून बहुतेक सामान्य किंमतीचे उपकरणांचे तुकडे 100 ते 110 डीबीच्या एसएनआरसह शीर्षस्थानी असतात. स्पष्टपणे नंतर, 32-बिट फायली त्याऐवजी अतिरेक दिसत आहेत.

आता आपल्याकडे डिजिटल ऑडिओची मुलभूत गोष्टी समजली आहेत, चला तर मग आणखी काही तांत्रिक बाबींकडे जाऊया.

पायर्‍यांचा मार्ग स्वर्गात

ऑडिओची समजूत काढणे आणि गैरसमज होण्याचे बहुतेक प्रश्न शैक्षणिक स्त्रोत आणि कंपन्या व्हिज्युअल संकेतकांचा वापर करून फायदे समजावून सांगण्याचा प्रयत्न करतात. आपण कदाचित नमुना दरासाठी बिट-डेथिंग आणि आयताकृती दिसणार्‍या ओळींसाठी पायर्यांची एक मालिका म्हणून दर्शविलेले ऑडिओ पाहिले असतील. जेव्हा आपण त्याची तुलना गुळगुळीत दिसत असलेल्या अ‍ॅनालॉग वेव्हफॉर्मशी करता तेव्हा हे खरोखर चांगले दिसत नाही, म्हणून अधिक अचूक आउटपुट वेव्हफॉर्मचे प्रतिनिधित्व करण्यासाठी “नितळ” पायर्या सहज दिसणे सोपे आहे.

हे कदाचित लोकांसाठी सोपी विक्री असू शकते, परंतु ही सामान्य “जिना” अचूकता एक समान दिशा आहे आणि डिजिटल ऑडिओ प्रत्यक्षात कसे कार्य करते हे समजण्यास अपयशी ठरते. दुर्लक्ष करा.

तथापि, हे दृश्य प्रतिनिधित्व ऑडिओ कार्य कसे करते हे चुकीचे वर्णन करते. जरी हे गोंधळलेले दिसत असले तरी, गणितानुसार Nyquist वारंवारतेखालील डेटा, ते नमूना दराच्या अर्ध्या भागाला पूर्णपणे पकडले गेले आहे आणि अचूकपणे पुनरुत्पादित केले जाऊ शकते. हे दर्शवा, अगदी नेक्विस्ट फ्रिक्वेन्सीमध्ये, ज्यास बर्‍याचदा गुळगुळीत साइन वेव्हपेक्षा स्क्वेअर वेव्ह म्हणून प्रतिनिधित्व केले जाऊ शकते, आमच्याकडे वेळेत एका विशिष्ट बिंदूवर विशालतेसाठी अचूक डेटा आहे, जो आपल्याला आवश्यक आहे. आम्ही मानव नेहमीच चुकून नमुन्यांमधील जागेकडे पाहत असतो, परंतु डिजिटल सिस्टम त्याच प्रकारे कार्य करत नाही.

बिट-खोलीकरण बहुधा अचूकतेशी जोडलेले असते, परंतु खरोखर ते सिस्टम ध्वनी कार्यक्षमतेचे वर्णन करते. दुसर्‍या शब्दांत, सर्वात लहान शोधण्यायोग्य किंवा पुनरुत्पादक सिग्नल.

जेव्हा प्लेबॅकचा विचार केला जातो तेव्हा हे थोडेसे अवघड होऊ शकते, कारण “शून्य-ऑर्डर होल्ड” डीएक्स ही संकल्पना समजण्यास सुलभ आहे, जे एका पायर्‍याच्या पायरीवर परिणाम देणा a्या सेट नमुना दराच्या आधारे फक्त मूल्यांमध्येच बदलते. हे प्रत्यक्षात ऑडिओ डीएक्स कसे कार्य करतात याचे निष्पक्ष प्रतिनिधित्व नाही, परंतु आम्ही येथे असताना आम्ही हे उदाहरण वापरुन हे सिद्ध करू शकतो की आपण तरीही त्या पायairs्यांविषयी काळजी करू नये.

लक्षात घेण्यातील एक महत्त्वाची वस्तुस्थिती अशी आहे की सर्व वेव्हफॉर्म एकाधिक साइन वेव्हजची बेरीज, मूलभूत वारंवारता आणि हार्मोनिक गुणाकारांवर अतिरिक्त घटक म्हणून व्यक्त केले जाऊ शकतात. त्रिकोण लाट (किंवा एक पायair्या पाय step्या) मध्ये विचित्र कमी होत असताना विचित्र हार्मोनिक्स असतात. तर, आमच्याकडे आमच्या नमुन्या दराने खूप लहान पावले असल्यास आपण असे म्हणू शकतो की तेथे काही अतिरिक्त हार्मोनिक सामग्री जोडली गेली आहे, परंतु ती आपल्या श्रव्य (Nyquist) वारंवारता आणि कदाचित त्याहून काही पटीने वाढते, म्हणून आम्ही जिंकलो तरीही त्यांना ऐकायला सक्षम नाही. शिवाय, काही घटकांचा वापर करून फिल्टर करणे हे अगदी सोपे आहे.

जर आम्ही डीएसी नमुने वेगळे केले तर आम्ही सहजपणे पाहू शकतो की आमचा इच्छित सिग्नल डीएसी नमुना दरावर अतिरिक्त वेव्हफॉर्मसह योग्य प्रकारे दर्शविला गेला आहे.

हे सत्य असल्यास, द्रुत प्रयोगाने आम्ही हे पाहण्यास सक्षम असले पाहिजे. चला मुलभूत शून्य-ऑर्डर होल्ड डीएसीकडून सरळ आउटपुट घेऊ आणि अगदी सोप्या 2 च्या माध्यमातून सिग्नल फीड करूएनडी अर्ध्या नमुना दराच्या आधारे कमी पास फिल्टर सेट करा. मी येथे प्रत्यक्षात फक्त 6-बिट सिग्नल वापरला आहे, जेणेकरुन आम्ही प्रत्यक्षात ऑसिलोस्कोपवर आउटपुट पाहू शकतो. 16-बिट किंवा 24-बिट ऑडिओ फाईलमध्ये फिल्टरिंगच्या आधी आणि नंतर दोन्ही ठिकाणी सिग्नलवर बराच आवाज होता.

त्याऐवजी एक क्रूड उदाहरण, परंतु हे असे सिद्ध करते की या गोंधळलेल्या पायर्यामध्ये ऑडिओ डेटा परिपूर्णपणे तयार केला गेला आहे.

आणि जणू जादूनेच, पाय s्या उतरणे जवळजवळ पूर्णपणे अदृश्य झाले आहे आणि फक्त आमच्या साइन वेव्ह आउटपुटमध्ये व्यत्यय आणणार नाही अशा लो-पास फिल्टरचा वापर करून आउटपुट “हळूवार” झाले आहे. प्रत्यक्षात आम्ही जे काही केले आहे ते सिग्नलचे काही भाग फिल्टर केले आहे जे आपण कधीही ऐकले नाही आहे. मुळात विनामूल्य (अतिरिक्त दोन घटकांकरिता दोन कॅपेसिटर आणि दोन प्रतिरोधकांची किंमत 5 पेन्सपेक्षा कमी असते) हे खरोखर वाईट परिणाम नाही, परंतु या ध्वनी आणखी कमी करण्यासाठी आम्ही आणखी अत्याधुनिक तंत्रज्ञान वापरू शकतो. अजून उत्तम, या चांगल्या दर्जाच्या डीएक्समध्ये मानक म्हणून समाविष्ट केल्या आहेत.

अधिक वास्तविक उदाहरण देऊन, ऑडिओसह वापरण्यासाठी कोणतीही डीएसी एक इंटरपोलेशन फिल्टर देखील दर्शवेल, ज्यास अप-नमूना म्हणून ओळखले जाते. इंटरपोलेशन म्हणजे दोन नमुन्यांमधील दरम्यानचे बिंदू मोजण्याचा एक सोपा मार्ग आहे, जेणेकरून आपला डीएसी प्रत्यक्षात स्वतःहून हे बरेच “स्मूथिंग” करीत आहे आणि नमुना दर दुप्पट किंवा चौगुना करण्यापेक्षा बरेच काही आहे. अजून चांगले, त्यात कोणतीही अतिरिक्त फाइल जागा घेणार नाही.

सामान्यत: कोणत्याही डीएसीमध्ये त्याचे मीठ किमतीचे आढळणारे इंटरपोलेशन फिल्टर्स जास्त सॅम्पलिंग दरासह फायली घेण्यापेक्षा बरेच चांगले समाधान आहेत.

असे करण्याच्या पद्धती बर्‍याच जटिल असू शकतात, परंतु मूलत: आपला डीएसी आपल्या ऑडिओ फाईलच्या नमुना वारंवारतेच्या सुचनेपेक्षा त्याचे उत्पादन मूल्य बरेच वेळा बदलत आहे. हे नमुना घेण्याच्या वारंवारतेच्या बाहेर अगदी ऐकू न येण्यासारख्या पायर्‍या असलेल्या हार्मोनिक्सला ढकलते, ज्यामुळे कमी तरंग असलेले कमी, अधिक सहजपणे गाठता येण्याजोग्या फिल्टरचा वापर करण्यास अनुमती देते, म्हणून आम्हाला खरोखर ऐकायचे असलेले बिट्स जतन करुन ठेवता येते.

आम्ही ऐकू शकत नाही ही सामग्री आपण का हटवू इच्छित आहोत याबद्दल आपल्याला उत्सुकता असल्यास, एक एम्प्लीफायरमध्ये म्हणा, सिग्नल साखळीच्या खाली हा अतिरिक्त डेटा पुन्हा तयार करणे म्हणजे ऊर्जा वाया घालवते. याव्यतिरिक्त सिस्टममधील इतर घटकांवर अवलंबून, ही उच्च वारंवारता “अल्ट्रा-सोनिक” सामग्रीमुळे मर्यादित बँडविड्थ घटकांमध्ये उच्च प्रमाणात इंटरम्युलेशन विकृती होऊ शकते. म्हणूनच, आपल्या 192 केएचझेड फाईलमुळे त्या फाईल्समध्ये खरोखर कोणतीही अल्ट्रा-सोनिक सामग्री असेल तर त्या चांगल्यापेक्षा जास्त नुकसान होऊ शकते.

यापुढे आणखी पुरावा आवश्यक असल्यास, मी सर्कस लॉजिक सीएस 4272 (शीर्षस्थानी चित्रित) वापरुन उच्च गुणवत्तेच्या डीएसी कडून आउटपुट देखील दर्शवीन. सीएस 72२२२ मध्ये एक इंटरपोलेशन विभाग आणि आउटपुट फिल्टरमध्ये बिल्ट उभे आहे. आम्ही या चाचणीसाठी करत असलेले सर्व 24 केएचझेड येथे जास्तीत जास्त संभाव्य आउटपुट वेव्हफॉर्म देऊन डीएसीला दोन 16-बिट उच्च आणि कमी नमुने 48kHz येथे पोसण्यासाठी मायक्रो-कंट्रोलर वापरत आहेत. कोणतेही अन्य फिल्टरिंग घटक वापरले जात नाहीत, हे आउटपुट सरळ डीएसीकडून येते.

या स्टुडिओ ग्रेड डीएसी घटकातील 24 केएचझेड आउटपुट सिग्नल (शीर्ष) निश्चितपणे नेहमीच्या विपणन सामग्रीशी संबंधित आयताकृती वेव्हफॉर्मसारखे दिसत नाही. ओस्किलोस्कोपच्या तळाशी नमुना दर (एफएस) दर्शविला जातो.

आउटपुट साइन वेव्ह (वरच्या) वारंवारतेच्या घड्याळाच्या तळाशी (तळाशी) अर्ध्या गती किती आहे हे लक्षात घ्या. तेथे कोणतीही पायर्‍या पायर्‍या नाहीत आणि हे अत्यंत उच्च फ्रिक्वेंसी वेव्हफॉर्म अगदी अचूक साइन वेव्हसारखे दिसते, विपणन सामग्री किंवा आउटपुट डेटामध्ये अगदी अनौपचारिक झलक देखील सूचित करते. हे दर्शविते की केवळ दोन नमुन्यांसह, Nyquist सिद्धांत व्यावहारिकदृष्ट्या कार्य करते आणि आम्ही एक प्रचंड साधेपणा किंवा नमुना दराशिवाय कोणत्याही अतिरिक्त हार्मोनिक सामग्रीच्या अनुपस्थितीत शुद्ध साइन वेव्ह पुन्हा तयार करू शकतो.

32-बिट आणि 192 केएचझेड बद्दलचे सत्य

बहुतेक गोष्टींप्रमाणेच, सर्व जर्गोन आणि 32-बिटच्या मागे काही सत्य लपलेले आहे, 192 केएचझेड ऑडिओ असा आहे ज्याचा व्यावहारिक वापर आपल्या हाताच्या तळव्यात नाही. जेव्हा आपण स्टुडिओ वातावरणामध्ये असता तेव्हा हे डिजिटल गुणधर्म प्रत्यक्षात उपयोगात येतात, म्हणूनच “मोबाइलमध्ये स्टुडिओ गुणवत्तेचा ऑडिओ” आणण्याचा दावा करतो, परंतु जेव्हा आपण तयार खडक आपल्या खिशात घालायचा तेव्हा हे नियम लागू होत नाहीत.

प्रथम, नमुना दरासह प्रारंभ करूया. उच्च रिझोल्यूशन ऑडिओचा एक वारंवार फायदा म्हणजे आपण ऐकत नसलेल्या अल्ट्रा-सोनिक डेटाची धारणा असणे परंतु संगीतावर परिणाम होतो. कचरा, बहुतेक उपकरणे आमच्या श्रवणशक्तीच्या वारंवारतेच्या मर्यादेआधीच कमी पडतात, जवळपास 20kHz वर स्पेस रोल कॅप्चर करण्यासाठी वापरला जाणारा मायक्रोफोन आणि आपण वापरत असलेले आपले हेडफोन निश्चितच त्यापर्यंत वाढवणार नाहीत. जरी ते शक्य झाले तरी आपल्या कानांना ते सहजपणे ओळखू शकले नाही.

सामान्य मानवी श्रवण संवेदनशीलता 3 केएचझेडवर येते आणि 16 केएचझेड नंतर द्रुतगतीने बंद होऊ लागते.

तथापि, आकडेवारीचे नमुना घेताना आवाज कमी करण्यासाठी 192 केएचझेड सॅम्पलिंग उपयुक्त आहे (पुन्हा की कीवर्ड आहे), आवश्यक इनपुट फिल्टर्सच्या सोप्या बांधकामास परवानगी देते आणि हाय स्पीड डिजिटल प्रभावासाठी देखील हे महत्वाचे आहे. ऐकण्यायोग्य स्पेक्ट्रमच्या वरचे ओव्हरस्पाल्लिंग आम्हाला आवाज मजला खाली ठेवण्यासाठी सिग्नलची सरासरी काढण्याची परवानगी देते. आपणास आढळले आहे की आजकाल बरेच चांगले एडीसी (डिजिटल कन्व्हर्टरचे alogनालॉग) 64 bit-बिट ओव्हर-सॅम्पलिंग किंवा बरेच काही अंगभूत आहेत.

प्रत्येक एडीसीला त्याच्या Nyquist मर्यादेपेक्षा जास्त वारंवारता देखील काढून टाकण्याची आवश्यकता आहे, किंवा आपण उच्च भयानक ध्वनी ऐच्छिक स्पेक्ट्रममध्ये "दुमडलेले" असल्यामुळे भयानक आवाज काढू शकता. आमच्या 20 केएचझेड फिल्टर कॉर्नर फ्रिक्वेन्सी आणि जास्तीत जास्त नमुना दर या दरम्यानच्या अंतरात वास्तविक जगाच्या फिल्टरसाठी अधिक अनुकूल आहे जे आवश्यक असलेल्या सैद्धांतिक फिल्टर्सपेक्षा इतके कठोर आणि स्थिर असू शकत नाही. डीएसीच्या शेवटीही हेच खरे आहे, परंतु आम्ही दरम्यान चर्चा केल्यामुळे सहजपणे फिल्टरिंगसाठी हा आवाज उच्च आवृत्त्यांपर्यंत प्रभावीपणे ढकलला जाऊ शकतो.

स्टीपर फिल्टर पासबँडमध्ये अधिक लहरी. नमुना दर वाढविणे "स्लोअर" फिल्टर वापरण्यास अनुमती देते, जे श्रवण्य पासबँडमध्ये फ्लॅट वारंवारता प्रतिसाद जतन करण्यास मदत करते.

डिजिटल डोमेनमध्ये, स्टुडिओ मिक्सिंग प्रक्रियेमध्ये बर्‍याचदा वापरल्या जाणार्‍या फिल्टरसाठी समान नियम लागू होतात. उच्च नमुना दर स्टीपर, वेगवान अभिनय फिल्टरसाठी अनुमती देतात जे योग्यरित्या कार्य करण्यासाठी अतिरिक्त डेटा आवश्यक आहेत. जेव्हा प्लेबॅक आणि डीएसीचा विचार केला जातो तेव्हा यापैकी काहीही आवश्यक नसते, कारण आपण ज्या गोष्टी प्रत्यक्षात ऐकू शकता त्या आमच्यात केवळ रस असतो.

32-बिट वर जाताना, ज्याने कधीही दूरस्थपणे जटिल गणिताचे कोड बनवण्याचा प्रयत्न केला असेल त्याला पूर्णांक आणि फ्लोटिंग पॉईंट डेटासह, बिट खोलीचे महत्त्व समजेल. आम्ही चर्चा केल्याप्रमाणे, जितका आवाज कमी तितका कमी तितका कमी होतो आणि जेव्हा आम्ही गोल त्रुटींमुळे डिजिटल डोमेनमध्ये सिग्नलचे विभाजन किंवा वजा करणे सुरू करतो आणि गुणाकार किंवा जोडताना क्लिपिंग त्रुटी टाळण्यासाठी तेव्हा हे अधिक महत्वाचे होते.

स्टुडिओ ऑडिओ सॉफ्टवेअरसारख्या गणिताचे ऑपरेशन करत असताना सिग्नलची अखंडता जपण्यासाठी अतिरिक्त बिट-डेपिंग महत्त्वपूर्ण आहे. एकदा मास्टरिंग संपल्यानंतर आम्ही हा अतिरिक्त डेटा काढून टाकू शकतो.

येथे एक उदाहरण आहे, असे म्हणा की आम्ही 4-बिट नमुना घेतो आणि आपले वर्तमान नमुना 13 आहे, जे बायनरीमध्ये 1101 आहे. आता त्यास चार ने विभाजित करण्याचा प्रयत्न करा आणि आमच्याकडे 0011 किंवा फक्त 3. बाकी आहे. आम्ही अतिरिक्त 0.25 गमावले आहे आणि जर आम्ही अतिरिक्त गणित करण्याचा प्रयत्न केला किंवा सिग्नलला पुन्हा एनालॉग वेव्ह फॉर्ममध्ये बदलण्याचा प्रयत्न केला तर ही एक त्रुटी दर्शवेल.

या गोल त्रुट्या अगदी कमी प्रमाणात विकृती किंवा आवाज म्हणून प्रकट होतात, ज्या मोठ्या संख्येने गणिती कार्ये जमा करू शकतात. तथापि, आम्ही दुफळी किंवा दशांश बिंदू म्हणून वापरण्यासाठी माहितीच्या अतिरिक्त बिटसह हे 4-बिट नमुना वाढवल्यास आम्ही अतिरिक्त डेटा पॉईंट्सचे आभार मानून विभाजन करणे, जोडणे आणि एकाधिक करणे सुरू ठेवू शकतो. तर वास्तविक जगात, 16 किंवा 24 बिट वर नमुना घेणे आणि नंतर प्रक्रियेसाठी या डेटाला 32-बिट स्वरूपात रुपांतरित करणे आवाज आणि विकृती वाचविण्यात मदत करते. आम्ही आधीच सांगितल्याप्रमाणे, 32-बिट्स अचूकतेचे बिंदू आहेत.

आता, हे समजणे तितकेच महत्वाचे आहे की जेव्हा आम्ही अ‍ॅनालॉग डोमेनमध्ये परत येतो तेव्हा आम्हाला या अतिरिक्त मुख्य खोलीची आवश्यकता नसते. जसे आपण आधीच चर्चा केली आहे की सुमारे 20-बिट डेटा (-120 डीबी ऑफ आवाजाची) संभाव्यत: शोधू शकणारी परिपूर्ण जास्तीत जास्त आहे, म्हणून आम्ही ऑडिओ गुणवत्तेवर परिणाम न करता अधिक वाजवी फाइल आकारात परत रूपांतरित करू शकतो, “ऑडिओफाइल” असूनही कदाचित हा हरवलेल्या डेटाबद्दल शोक व्यक्त करा.

तथापि, आम्ही अगदी थोड्याशा खोलीकडे जाताना काही गोल त्रुटी निश्चितपणे ओळखू जेणेकरून नेहमीच काही प्रमाणात अतिरिक्त विकृती दिसून येईल कारण या चुका नेहमी यादृच्छिकपणे होत नाहीत. 24-बिट ऑडिओमध्ये ही समस्या नसली तरी एनालॉग आवाज मजल्याच्या पलीकडे आधीच चांगला विस्तार केला गेला आहे, परंतु “डाइथिंग” नावाचे तंत्र 16-बिट फायलींसाठी सुबकपणे या समस्येचे निराकरण करते.

काटछाट आणि डिलिंगद्वारे ओळखल्या जाणार्‍या विकृतीच्या उदाहरणाची तुलना.

ऑडिओ नमुन्याच्या कमीतकमी लक्षणीय बिट यादृच्छिक विकृती त्रुटी दूर केल्यावर परंतु वारंवारतांमध्ये पसरलेल्या काही अत्यंत शांत यादृच्छिक पार्श्वभूमी आवाज सादर करून हे केले जाते. आवाजाची ओळख करुन देणे कदाचित अंतर्ज्ञानी दिसत असले तरीही यादृच्छिकतेमुळे हे ऐकू येईल अशा विकृतीचे प्रमाण कमी करते. याव्यतिरिक्त, मानवी कानाच्या वारंवारतेच्या प्रतिसाचा गैरवापर करणारे विशेष आवाज-आकाराचे डोईनिंग पॅटर्न्स वापरुन, 16-बिट dithered ऑडिओ प्रत्यक्षात आपल्या समजण्याच्या मर्यादेपर्यंत 120dB च्या अगदी जवळ असलेला ध्वनी मजला ठेवू शकतो.

32-बिट डेटा आणि 192kHz नमुना दरांचे स्टुडिओमध्ये उल्लेखनीय फायदे आहेत, परंतु समान नियम प्लेबॅकसाठी लागू होत नाहीत.

सरळ शब्दात सांगा, स्टुडिओला या हार्ड रिझोल्यूशन सामग्रीसह त्यांचे हार्ड ड्राइव्ह्स चिकटून राहू द्या, जेव्हा उच्च गुणवत्तेच्या प्लेबॅकचा विचार केला जातो तेव्हा आम्हाला त्या सर्व अनावश्यक डेटाची फक्त गरज नाही.

लपेटणे

आपण अद्याप माझ्याबरोबर असल्यास, स्मार्टफोन ऑडिओ घटक सुधारण्याच्या प्रयत्नांना संपूर्ण डिसमिसल म्हणून हा लेख समजू नका. नंबर टूटींग निरुपयोगी असले तरीही मोबाइल मार्केटमध्ये उच्च प्रतीचे घटक आणि उत्तम सर्किट डिझाइन एक उत्कृष्ट विकास आहे, परंतु आम्हाला फक्त उत्पादकांनी त्यांचे लक्ष योग्य गोष्टींवर केंद्रित केले आहे याची खात्री करणे आवश्यक आहे. उदाहरणार्थ, एलजी व्ही 10 मधील 32-बिट डीएसी आश्चर्यकारक वाटते, परंतु त्याचा फायदा घेण्यासाठी आपल्याला मोठ्या ऑडिओ फाईल आकाराने त्रास देण्याची आवश्यकता नाही.

सैद्धांतिकदृष्ट्या समर्थित बिट-खोली किंवा नमुना दरापेक्षा कमी इंपिडेंस हेडफोन्स चालविण्याची क्षमता, डीएसीकडून जॅकमध्ये कमी आवाजातील मजला जतन करणे आणि कमीतकमी विकृती ऑफर करण्याची क्षमता यापेक्षा महत्त्वपूर्ण वैशिष्ट्ये आहेत आणि आम्ही आशा करू शकाल भविष्यात या बाबींमध्ये अधिक तपशीलात बुडविणे.

काल प्रकाशित झालेल्या ब्लॉग पोस्टमध्ये, यूट्यूबचे मुख्य कार्यकारी अधिकारी सुझान वोजकीकी यांनी उच्च प्रोफाईल YouTube निर्मात्यांद्वारे व्यासपीठावर असलेल्या काही भिन्न चिंतेचा थेट सामना केला. आपण कदाचित...

गेल्या वर्षी सप्टेंबरमध्ये गुगलने ही सेवा सुरू केल्याच्या अवघ्या चार वर्षानंतरच यूट्यूब गेमिंग अॅपला सेवानिवृत्त करणार असल्याचे जाहीर केले. आता, अॅपचा खरा शेवट या आठवड्यात 30 मे रोजी (मार्गे) येईल कडा...

शिफारस केली