აკუსტიკური ლოკალიზაცია დაგროვილი კორელაციით

Original web-page: http://cecas.clemson.edu/~stb/research/acousticloc/

სტენ ბირკფილდი და დანიელ გილმორი (Stan Birchfield and Daniel Gillmor)

აკუსტიკური ლოკალიზაციის ორი ტრადიციული ტექნიკაა სხივების შეცვლა და დროის დაგვიანების შეფასება. ისტორიულად უნდა აირჩიოს ამ ორი ტექნიკის ცვალებადობას შორის, რითაც მოხდა სავაჭრო ურთიერთობების სიზუსტის ან დროში შეფერხების შეფასების ალგორითმების სიჩქარეს შორის. ჩვენს გამოკვლევაში აღმოვაჩინეთ, რომ ეს კავშირი არ წარმოადგენს პრობლემას ფუნდამენტურად, არამედ მხოლოდ იმ გზასთან, რომლის საშუალებითაც ჩვენ ვუყურებთ მას. სინამდვილეში, არ უნდა შეეწირა სიზუსტის შესაწირი სიზუსტე, ყოველ შემთხვევაში, სცენარებში, რომლებშიც მიკროფონებს შორის დაშორება არც თუ ისე დიდია, მაგალითად, როდესაც მიკროფონები დახურულ ოთახში რამდენიმე მეტრამდეა დაშორებული.

ჩვენ შევიმუშავეთ ტექნიკა მოუწოდა  დაგროვილი კორელაცია, რომელიც აერთიანებს სიჩქარე დრო დაგვიანებით შეფასებით სიზუსტეს სხივის ფორმირება. როგორც ჩანს დიაგრამაზე იდეა ძალიან მარტივია. სიგნალები წყვილი მიკროფონები ჯვარი კორელაციაშია, და მთელი ჯვარი კორელაცია ვექტორი შეესაბამება საერთო კოორდინატთა სისტემა გავზომოთ ალბათობა იმისა, რომ ხმის წყარო არის ნებისმიერი რაოდენობის კანდიდატი ადგილას. პრეფილტინგი და დროებითი დამარბილებელი სურვილისამებრ ნაბიჯი, რომელიც შეიძლება დაემატოს ნებისმიერი ალგორითმი.

აკუსტიკური ლოკალიზაციის ალგორითმების უმთავრესი პრინციპი, მათ შორის დაგროვილი კორელაცია, არის ის, რომ ხმოვანი წყაროსგან ასხივებული ხმა ზოგადად სხვადასხვა დროს მიიღებს მასივიდან თითოეულ მიკროფონში. თითოეული მიკროფონისთვის სიგნალის ჩამოსვლის (ან ეკვივალენტურად, დროის შეფერხების) გაზომვის საშუალებით, შეიძლება დადგინდეს ხმის წყაროს ადგილმდებარეობა. განვიხილოთ შემთხვევა, როდესაც შესაძლებელია მხოლოდ მიკროფონის წყვილი, როგორც ეს მოცემულია ქვემოთ მოცემულ ფიგურაში. ხმის წყარო ერთ მიკროფონს ერთ დროს მიაღწევს t1 და სხვა დროს t2.  დროის შეფერხება t = t1 – t2 მისი შეფასება შესაძლებელია ორ მიკროფონურ სიგნალს შორის ჯვარედინი კორელაციის ვექტორის მწვერვალის არჩევით. თუ t სწორად არის შეფასებული, მაშინ ხმის წყარო უნდა განთავსდეს ისეთ წერტილში, რომელიც სივრცეშია t1 – t2 = t, რომელიც განსაზღვრავს ჰიპერბოლოს ერთ ნახევარს.

ჯვარედინი კორელაცია, რა თქმა უნდა, არ არის სრულყოფილი ტექნიკა და არ არსებობს იმის გარანტია, რომ ჯვარედინი კორელაციური ვექტორის პიკი იქნება დროულად დაგვიანების შეფასება. რეალური სიგნალებით, ჯვარედინი კორელაციის ვექტორი ჩვეულებრივ შეიცავს მრავალ მწვერვალს, ხოლო ნამდვილი დროის შეფერხება ხშირად არ იძლევა მაღალ მწვერვალს. დაგროვილი კორელაცია გაუმკლავდება ხმაურის ამ პრობლემას თითოეული მიკროფონის წყვილის მთელი ჯვარედინი კორელაციის ვექტორის შენარჩუნებით, ვიდრე მწვერვალის არჩევისას. როგორც ქვემოთ მოცემულია, ჯვარედინი კორელაციის ვექტორის თითოეული ელემენტი შეესაბამება სივრცეში სხვადასხვა ნახევრად ჰიპერბოლიდს, და ამ ელემენტის მნიშვნელობა მიუთითებს იმის ალბათობაზე, რომ ხმის წყარო მდებარეობს ამ ნახევრად ჰიპერბოლიდში. ნებისმიერი კანდიდატის ადგილმდებარეობისთვის, მისი ალბათობა – რომელიც დაფუძნებულია მხოლოდ მიკროფონების ერთი წყვილის მიერ მოწოდებული ინფორმაციის საფუძველზე – მოცემულია ახლომდებარე ნახევრად ჰიპერბოლოიდების მნიშვნელობებით. მრავალჯერადი მიკროფონის წყვილის მნიშვნელობები შეჯამებულია ამ ადგილმდებარეობის მთლიანი ალბათობის მოსაწყობად. მას შემდეგ, რაც ყველა ინფორმაცია იქნა გათვალისწინებული, მაშინ ხმის წყაროს ადგილმდებარეობის შეფასებად შეირჩევა ყველაზე მაღალი ალბათობის ადგილი. როგორც ადრე, წინასწარი დამუშავება ან/და დროებითი დაგლუვება შეიძლება გამოყენებულ იქნეს მხოლოდ აღწერილი ძირითადი ალგორითმის გარდა.

შემოწმებისას განტოლებები სხვადასხვა ტექნიკა ავლენს მჭიდრო კავშირი მათ შორის. დაგროვილი კორელაცია არის დაახლოების სხივის ფორმირება ვთქვათ, რომ დრო, რომელიც მიკროფონები მიიღოს ხმა არის მუდმივი ოფსეტური დრო, რომელშიც ხმა საგულისხმოა, რაც დაახლოებით ასეა შეიცავს გარემოში, როგორიცაა შიდა ოთახში. ამავე დროს, დაგროვილი კორელაციას განზოგადება დრო დაგვიანებით შეფასებით ფორმულირება, რადგან ისინი ორივე გაუზიაროს არსებითი გამოთვლები, კერძოდ ჯვარი შეესაბამება თითოეული წყვილი მიკროფონი სიგნალები; იმ განსხვავებით, რომ დაგროვილი კორელაცია ინარჩუნებს მთელი ჯვარი კორელაცია ვექტორი, ვიდრე უბრალოდ პიკი. შედეგად, დაგროვილი კორელაცია იღებს ყველა შესაძლო ინფორმაციის გათვალისწინებით, სანამ ის იღებს გადაწყვეტილებას, რომელიც უზრუნველყოფს სიმტკიცე. პრინციპი მინიმუმ ვალდებულება, ცნობილი ფილოსოფია ალგორითმი განვითარებას. დაგროვილი კორელაცია ასევე ცნობილია, როგორც პირდაპირი მეთოდი, რადგან ეს პირდაპირ ითვლის შედეგი ყოველგვარი შუალედური გადაწყვეტილება, რომ აქვს პოტენციალი, რომ დაკარგავს ინფორმაცია.

მსგავსება შორის ალგორითმები იწვევს, ბუნებრივია, რომ გამაერთიანებელი ფარგლებში, როგორც ეს ნაჩვენებია ქვემოთ მოყვანილ ცხრილში. ჩამოთვლილი ალგორითმების სხივის ფორმირება დაგროვილი კორელაცია და ხაზოვანი კვეთა (პოპულარული დრო დაგვიანებით შეფასებით ტექნიკა), ერთად რამდენიმე სხვა ვარიაციები. ყველა ტექნიკას შეიძლება გამოიხატოს როგორც კომპიუტერული ალბათობა ადგილმდებარეობა q გამოყენებით განტოლება ნაჩვენები. არსებობს სამი განსხვავებები ალგორითმები: (1), თუ როგორ დააკავშიროთ ინფორმაციას მრავალი მიკროფონი წყვილი, გამოიხატება ფუნქცია G; (2) ინტეგრაციის ლიმიტები შედარების სიგნალები ერთი წყვილი, ტყვედ ფუნქცია T; და (3), თუ როგორ წონა ენერგეტიკული ტერმინი, მიერ მნიშვნელობა . მაგიდიდან ნათელია, რომ სხივის ფორმირება არის ზუსტი, დრო დაგვიანებით შეფასებით ეფექტური და დაგროვილი კორელაცია როგორც ზუსტი და ეფექტური.

დაგროვილი კორელაცია მარტივია განსახორციელებლად, მასშტაბური დავალებები უფრო სწრაფია, ვიდრე სხივების დამუშავება, და ნაჩვენებია, რომ შედეგებს წარმოქმნის არსებითად იგივე სიზუსტით, როგორც სხივების შეცვლა. ქვემოთ მოცემულია აუდიტის ჩარჩოზე დაანგარიშებული ალბათობის ფუნქცია დაგროვილი კორელაციით და სხივური ფორმით, რაც ასახავს იმას, რომ შედეგებს შორის განსხვავება ხშირად განსხვავდება. უფრო ვრცელი ექსპერიმენტები, უფრო დეტალურ განმარტებასთან ერთად, შეგიძლიათ იხილოთ ამ თემის პუბლიკაციებში.

დაგროვილი კორელაცია
სხივი

 

 

 

 

 

 

პუბლიკაციები