
हाल के एक अध्ययन में, चीन के शोधकर्ताओं ने एक चिप स्केल LiDAR प्रणाली विकसित की है जो दृश्य के पूरे क्षेत्र में व्यापक जागरूकता बनाए रखते हुए रुचि के क्षेत्रों (आरओआई) पर गतिशील रूप से उच्च रिज़ॉल्यूशन सेंसिंग को केंद्रित करके मानव आंख के फोवेशन की नकल करती है।
यह अध्ययन जर्नल में प्रकाशित हुआ हैप्रकृति संचार.
LiDAR सिस्टम मिलीमीटर परिशुद्धता के साथ 3D दृश्यों को मैप करने के लिए लेजर बीम फायर करके कारों, ड्रोनों और रोबोटों को स्वयं चलाने में मशीन विजन को शक्ति प्रदान करता है। आंख अपने सघनतम सेंसरों को फ़ोविया (तीव्र केंद्रीय दृष्टि स्थान) में पैक करती है और जो महत्वपूर्ण है उस पर नज़र डालती है। इसके विपरीत, अधिकांश LiDAR कठोर समानांतर बीम या स्कैन का उपयोग करते हैं जो हर जगह एक समान (अक्सर मोटे) रिज़ॉल्यूशन फैलाते हैं। विस्तार को बढ़ावा देने का अर्थ समान रूप से अधिक चैनल जोड़ना है, जो लागत, शक्ति और जटिलता को बढ़ाता है।
टीम का डिज़ाइन आरओआई में 0.012 डिग्री के "रेटिना से परे" कोणीय रिज़ॉल्यूशन को प्राप्त करता है, जो आंख की अनुमानित 0.017 डिग्री सीमा से दोगुना तेज है। इसका मतलब यह है कि सिस्टम सबसे छोटे कोणों से अलग किए गए बिंदुओं को अलग कर सकता है, जैसे कि दूर के सड़क चिह्न पर बारीक विवरण चुनना। यह महंगी क्रूर बल स्केलिंग से बचते हुए, मांग पर समानांतर सेंसिंग चैनलों को पुनः आवंटित करता है।
Phys.org ने पेकिंग यूनिवर्सिटी के स्कूल ऑफ इलेक्ट्रॉनिक्स से अध्ययन के सह-लेखकों, रुइक्सुआन चेन और ज़िंगजुन वांग से बात की।
शोधकर्ताओं ने समझाया, "प्रेरणा जैविक और मशीन धारणा के बीच व्यावहारिक बेमेल से आती है।" "मानव आंख ध्यान को पुनः आवंटित करके उच्च तीक्ष्णता और ऊर्जा दक्षता प्राप्त करती है {{1}जो महत्वपूर्ण है उस पर संसाधनों को केंद्रित करते हुए व्यापक जागरूकता बनाए रखती है। इसके विपरीत, LiDAR रिज़ॉल्यूशन को अक्सर 'हर जगह अधिक चैनलों' द्वारा अपनाया जाता है, जो जल्दी ही महंगा और ऊर्जा की भूखा हो जाता है।"
स्केलिंग की समस्या
मशीन विज़न सिस्टम का विस्तार पारंपरिक कैमरों से आगे बढ़कर LiDAR सेंसर तक हो गया है, जो सटीक दूरी माप और 3डी पर्यावरणीय धारणा को सक्षम बनाता है। हालाँकि, निष्क्रिय कैमरों के विपरीत, LiDAR प्रत्येक पिक्सेल के लिए उत्सर्जन और रिसेप्शन हार्डवेयर की मांग करता है, जो प्राप्त रिज़ॉल्यूशन को सीमित करता है।
LiDAR रिज़ॉल्यूशन में सुधार के लिए वर्तमान दृष्टिकोण एक गंभीर बाधा का सामना कर रहे हैं। चैनल दोहराव रैखिक रिज़ॉल्यूशन लाभ प्रदान करता है लेकिन जटिलता, शक्ति और लागत में सुपरलीनियर विस्फोटों को ट्रिगर करता है।
"सबसे पहले, रिज़ॉल्यूशन हार्डवेयर चैनल गिनती और स्कैनिंग यांत्रिकी से कसकर जुड़ा हुआ है। दूसरा, LiDAR एक सक्रिय सेंसर है: प्रत्येक पिक्सेल प्रभावी रूप से संसाधनों को प्रसारित करने और प्राप्त करने दोनों की लागत लेता है," शोधकर्ताओं ने समझाया। "यह निष्क्रिय इमेजिंग की तुलना में अनुकूली फोकस को मौलिक रूप से कठिन बनाता है, क्योंकि आपको आंखों की सुरक्षा बाधाओं को पूरा करते हुए ऑप्टिकल पावर, रिसीवर संवेदनशीलता और डिजिटलीकरण बैंडविड्थ का प्रबंधन करना होगा।"
सुसंगत आवृत्ति -संग्राहक सतत तरंग LiDAR के लिए, यह चुनौती विशेष रूप से गंभीर है। प्रत्येक सुसंगत चैनल को स्थिर आवृत्ति नियंत्रण, परिष्कृत रिसेप्शन हार्डवेयर और सख्त अंशांकन की आवश्यकता होती है। इससे बड़े पैमाने पर चैनल दोहराव को आर्थिक रूप से उचित ठहराना कहीं अधिक कठिन हो जाता है।
एक बायोमिमेटिक समाधान
शोधकर्ताओं का समाधान दो प्रमुख प्रौद्योगिकियों को जोड़ता है। इनमें 100 एनएम से अधिक की ट्यूनिंग रेंज के साथ एक फुर्तीली बाहरी कैविटी लेजर (ईसीएल) और पतली फिल्म लिथियम नाइओबेट (टीएफएलएन) प्लेटफॉर्म पर निर्मित पुन: कॉन्फ़िगर करने योग्य इलेक्ट्रो {3}ऑप्टिक फ्रीक्वेंसी कॉम्ब्स शामिल हैं।
ईसीएल सुसंगत रेंजिंग के लिए उच्च गुणवत्ता वाले FMCW चिरप सिग्नल प्रदान करता है और तरंग दैर्ध्य नियंत्रित बीम {{2} स्टीयरिंग तंत्र के रूप में कार्य करता है। केंद्र तरंग दैर्ध्य को ट्यून करके, सिस्टम दृश्य के विस्तृत क्षेत्र में अपनी देखने की दिशा को तेजी से पुनर्निर्देशित कर सकता है।
फिर इलेक्ट्रो -ऑप्टिक कंघी एक ही चिरप्ड लेजर स्रोत से कई समानांतर FMCW वाहक उत्पन्न करती है। महत्वपूर्ण रूप से, रेडियो फ़्रीक्वेंसी ड्राइव स्थितियों को समायोजित करने से कंघी के बीच की दूरी बदल जाती है।
शोधकर्ताओं ने कहा, "यह वह है जो 'ज़ूम' को सक्षम बनाता है। हम किसी चयनित क्षेत्र में बिंदु घनत्व को बढ़ा सकते हैं (बारीक नमूनाकरण) या इसे आराम दे सकते हैं (मोटे नमूने) बिना प्रकाशिकी को बदले या चैनल जोड़े।"
यह प्रणाली उस चीज़ को नियोजित करती है जिसे शोधकर्ता "सूक्ष्म{0}}समानांतरता" कहते हैं। इसका अर्थ है गतिशील पुनर्स्थापन के माध्यम से कहीं अधिक स्कैनिंग लाइनों के समतुल्य प्राप्त करने के लिए मध्यम संख्या में भौतिक चैनलों का उपयोग करना।
प्रायोगिक सत्यापन
टीम ने तीन प्रायोगिक परिदृश्यों में सिस्टम की क्षमताओं का प्रदर्शन किया, जिससे मानव रेटिना की नाममात्र सीमा को पार करते हुए केंद्रित क्षेत्रों में 0.012 डिग्री का कोणीय रिज़ॉल्यूशन प्राप्त किया गया।
स्थैतिक दृश्य इमेजिंग में, सिस्टम ने दृश्य स्कैन के पूर्ण क्षेत्र के लिए 54 x 71 पिक्सेल के रिज़ॉल्यूशन पर और स्थानीय रूप से केंद्रित स्कैन के लिए 17 x 71 पिक्सेल के रिज़ॉल्यूशन पर एक अनुरूपित सड़क वातावरण को कैप्चर किया। इन केंद्रित स्कैन ने ऊर्ध्वाधर विवरण घनत्व को चौगुना कर दिया, जिससे पहले से अदृश्य बाधाओं का पता चला, जिसमें 90% बिंदु 1.3 सेमी से कम सटीक थे।
शोधकर्ताओं ने LiDAR कैमरा फ़्यूज़न का भी प्रदर्शन किया, जिससे रंगीन बिंदु बादल बनते हैं जो RGB उपस्थिति डेटा के साथ सटीक 3D ज्यामिति को जोड़ते हैं। मानक बनाम केंद्रित स्कैन की तुलना करने पर, रंग हिस्टोग्राम संरेखण में लगभग 10% सुधार हुआ, जो 3डी बिंदुओं और छवि पिक्सेल के बीच बेहतर पत्राचार का संकेत देता है।
शोधकर्ताओं ने बताया, "एक कैमरे के साथ LiDAR को जोड़कर, हम रंगीन बिंदु बादल उत्पन्न करते हैं और दृश्य प्रतिनिधित्व को समृद्ध करते हैं, जो व्याख्या में सुधार करता है और डाउनस्ट्रीम धारणा कार्यों का समर्थन करता है जो बनावट और अर्थ संबंधी संकेतों पर निर्भर करते हैं।"
शायद सबसे प्रभावशाली बात यह है कि टीम ने वास्तविक समय में 4डी में प्लस इमेजिंग के साथ बास्केटबॉल टॉस को कैप्चर किया, जहां प्रत्येक बिंदु पर स्थिति, स्पिन वेग, सतह परावर्तन और रंग एक साथ दिखाई दिए। दृश्य के विस्तृत क्षेत्र में 8 हर्ट्ज़ पर, इससे मानक 3डी LiDAR के लिए अदृश्य गति पैटर्न का पता चला।
प्रायोगिक कार्य से महत्वपूर्ण सिस्टम लेवल ट्रेडऑफ़ का पता चला जो भविष्य के विकास पथों को सूचित करता है।
शोधकर्ताओं ने कहा, "सबसे स्पष्ट कोणीय रिज़ॉल्यूशन और प्रति -चैनल माप हेडरूम के बीच तनाव है।" "हमारे समानांतर सुसंगत रीडआउट में, प्रत्येक चैनल को अपने स्वयं के गैर-अतिव्यापी विद्युत बैंड पर कब्जा करना चाहिए। जब हम पुनरावृत्ति दर को कम करते हैं, तो हम वास्तव में कोणीय नमूने को बेहतर कर सकते हैं, लेकिन प्रयोग से पता चलता है कि यह प्रति-चैनल रीडआउट बैंडविड्थ को भी संपीड़ित करता है।"
टीम ने व्यावहारिक तैनाती की दिशा में प्रौद्योगिकी को आगे बढ़ाने के लिए कई प्राथमिकता दिशाओं की पहचान की। इनमें टीएफएलएन प्लेटफार्मों पर गहरा मोनोलिथिक एकीकरण, बेहतर रेंज रिज़ॉल्यूशन के लिए अल्ट्रा{1}वाइडबैंड स्वेप्ट स्रोतों का विकास, और इवेंट संचालित धारणा के लिए बंद{2}लूप ध्यान नीतियों का कार्यान्वयन शामिल है।
फाइबर लिंक का उपयोग करने वाले वर्तमान प्रयोग ध्रुवीकरण अस्थिरता का परिचय देते हैं जो सामग्री वर्गीकरण क्षमताओं को सीमित करता है।
शोधकर्ताओं ने कहा, "हालांकि, हम कल्पना करते हैं कि अखंड एकीकरण मूल रूप से इस बाधा को हल करेगा।" "अस्थिर फ़ाइबर पथों से चिप वेवगाइड्स तक सीमित होकर, हम स्थिर ध्रुवीकरण पुनर्प्राप्ति प्राप्त कर सकते हैं।"
बायोनिक LiDAR प्रणाली स्वायत्त वाहनों, हवाई और समुद्री ड्रोन, रोबोटिक्स और न्यूरोमॉर्फिक दृष्टि प्रणालियों तक फैले संभावित अनुप्रयोगों की पेशकश करती है। शोधकर्ताओं के अनुसार, LiDAR से परे, पुन: कॉन्फ़िगर करने योग्य कॉम्ब्स ऑप्टिकल संचार, सुसंगतता टोमोग्राफी, संपीड़ित सेंसिंग और सटीक मेट्रोलॉजी के लिए तेज़ वर्णक्रमीय विश्लेषण सक्षम करते हैं।









