Яка різниця між негативною матричною факторизацією та сингулярним розкладанням значення?


Відповідь 1:

Обидва є матричними методами розкладання. Оригінальна матриця, в якій нас цікавить, може бути дуже «великою», розрідженою, без порядку. Факторинг дасть набір більш керованих, компактних і упорядкованих матриць. Далі, використовуючи ці фактори, легко знайти приховані зв’язки (якщо такі є), як кореляція, ортогональність, підпростір / проліт / проекція в оригінальній матриці. Для матриці існує багато розкладання. Сингулярне декомпозиція величини (SVD), невід'ємна матрична факторизація (NMF або NNMF), розкладання LU, розкладання QR, розклад Чолскі і т. Д. Різниця походить від застосовності та фізичної значущості, яку можна визначити на основі домену, в якому вони перебувають застосовано (наприклад, обробка сигналів з додатками для бездротового зв'язку, аналіз часових рядів, обробка мови та зображень, стиснення та зберігання даних, обробка тексту та даних, захист конфіденційності / кодування даних тощо). Ось кілька покажчиків:

1. Фактори SVD містять як позитивні, так і негативні записи, тоді як фактори NMF суворо позитивні. Це корисно у випадку видобутку тексту, де зазвичай матриця TF або TF-IDF піддається факторизації. Оскільки записи оригінальної матриці є позитивними та мають фізичне значення (терміни частоти ...), колись хотілося б, щоб фактори були позитивними, щоб фізичні зв'язки були безпосередньо зроблені.

2. Фактори SVD можуть бути пов'язані з Eigen-функціями системи, коли оригінальна матриця представляла систему, щодо якої зацікавлена ​​з точки зору обробки сигналів. Вони використовуються при розкладі підпростору, характерних матриць (корисно в обробці мови та зображень - розпізнавання обличчя тощо). NMF також може бути використаний, але пов'язані фізичні відносини є більш непрямими, а значить, "стомлюючими" / "більш математично залученими"

3. SVD дає унікальні фактори, тоді як NMF фактори не є унікальними. Це робить NMF більш придатним для алгоритмів захисту конфіденційності.


Відповідь 2:

Сингулярне розкладання значення - це факторизація. Він бере прямокутні матриці і дає певні гарантії з отриманим результатом трьох матриць. Зазвичай ми пишемо це як A = U (Sigma) V ^ t. Ви повинні подивитися на властивості U, Sigma та V. Цікавим дослідженням має бути геометричне тлумачення цих трьох матриць. Він стосується еліпсів та їх осей як за напрямом, так і за довжиною. Я дуже раджу вивчити векторні простори в абстрактній алгебрі.