Beyond the independent component analysis: New blind acoustic sound separation in real world via single‐input multiple‐output‐based independent component analysis

2006 ◽  
Vol 120 (5) ◽  
pp. 3045-3045
Author(s):  
Hiroshi Saruwatari
2020 ◽  
Vol 8 (3) ◽  
pp. 219
Author(s):  
Angga Pramana Putra ◽  
I Gede Arta Wibawa

Geguntangan is pesantian in religious ceremonies in Bali accompanied by gamelan music. The human sense of hearing tends to have limitations, which causes not all vocals mixed with gamelan to be heard clearly. Therefore we need a system that can be used to separate vocals with gamelan in the geguntangan. Separation of sound sources is categorized as Blind Source Separation (BSS) or also called Blind Signal Separation, which means an unknown source. The algorithm used to handle BSS is the Fast Independent Component Analysis (FastICA) algorithm with a focus on separating the sound signal in a wav-format sound file. FastICA algorithm is used for the sound separation process with the value parameter used is Mean Square Error (MSE). From the simulation results show the results of MSE calculations using the mixing matrix [0.3816, 0.8678], [0.8534, -0.5853] obtained the results for the FastICA method, the MSE value is 3.60 x 10-5 for the vocal and 1.71 x 10-6 for the instrument.


Author(s):  
Takeshi Koya ◽  
◽  
Nobuo Iwasaki ◽  
Takaaki Ishibashi ◽  
Go Hirano ◽  
...  

In real world environments where acoustic signals are contaminated with various noises, it is difficult to estimate the Signal-to-Noise Ratio (SNR) only from signals observed at microphones; the knowledge of acoustic transfer functions and original source signals is inevitable for SNR estimation. The present paper proposes a method to estimate SNR approximately in the real world environments without the knowledge of transfer functions and source signals: SNR is estimated after application of Independent Component Analysis (ICA) to the signals observed at microphones. Our proposed method also works as a speech segment detector since detection of speech segments are necessarily carried out in the course of SNR estimation. From several experimental results, the proposed method has been confirmed to be valid.


2011 ◽  
Vol 14 (4) ◽  
pp. 34-42
Author(s):  
Quang Tan Truong ◽  
Huy Quang Tran ◽  
Phuong Huu Nguyen

Our ears often simultaneously receive various sound sources (speech, music, noise . . .), but we can still listen to the intended sound. A system of speech recognition must be able to achieve the same intelligent level. The problem is that we receive many mixed (combined) signals from many different source signals, and would like to recover them separately. This is the problem of Blind Source Separation (BSS). In the last decade or so a method has been developed to solve the above problem effectively, that is the Independent Component Analysis (ICA). There are many ICA algorithms for different applications. This report describes our application to sound separation when there are more sources than mixtures (underdetermined case). The results were quite good.


Author(s):  
П. Саксена ◽  
С. Б. Патель ◽  
Дж. К. Бхалани

В статье исследована и реализована новая схема полуслепого оценивания канала для системы связи MIMO (Multiple-Input Multiple-Output) для случая канала с квазистатическим рэлеевским замиранием. В этой схеме канальная матрица H остается относительно постоянной в пределах блока. Канальную матрицу H можно разложить на матрицу вращения Q и нижнюю треугольную матрицу R. Треугольная матрица R оценивается вслепую при использовании метода обобщенного разложения Холецкого GCD (generalized Cholesky decomposition) на основе QR-разложения выходной ковариационной матрицы, которая использует стохастический метод слепого разделения входных сигналов на основе анализа независимых компонентов ICA (Independent Component Analysis). Матрица Q оценивается по ортогональным пилотным символам при использовании нового подхода, основанного на QR-разложении, для минимизации целевой функции. При использовании этого нового подхода ортогональные пилотные символы можно разложить на детерминированную эрмитову матрицу и верхнюю треугольную матрицу, используя QR-разложение. Наконец, матрицу Q можно оценить, используя метод обратной подстановки, который представлен в данной работе. Проведено моделирование при использовании двух передающих антенн с пространственно-временным кодом Аламоути и комбинаций из 2 и 6 приемных антенн, чтобы исследовать эффективность работы новой схемы оценивания по сравнению со стандартными схемами оценивания на базе методов наименьших квадратов LS (Least Squares) и максимальной апостериорной оценки MAP (Maximum a posterior) при использовании схемы модуляции данных BPSK (двоичная фазовая манипуляция). Полученные результаты показали, что новая схема превосходит по эффективности работы другие схемы и демонстрирует значительно лучший результат в отношении характеристики коэффициента битовых ошибок BER. Таким образом, новая схема может быть весьма полезной для решения сложной задачи полуслепого оценивания канала MIMO с помощью метода QR-разложения матрицы. Кроме того, представлен анализ ошибок в терминах матрицы ковариации ошибки при рассмотрении шума для случая ненулевой ошибки (практический случай) по сравнению со случаем нулевой ошибки.


Sign in / Sign up

Export Citation Format

Share Document