계측실험 보고서
- 최초 등록일
- 2010.11.23
- 최종 저작일
- 2010.11
- 25페이지/ MS 워드
- 가격 1,000원
소개글
계측실험 보고서
목차
1. 목적
2. 이론
3. 실험 방법
4. 실험 결과
5. 토의 및 결론
6. 참고문헌
본문내용
A. 음성 카드에 일정 범위 이하 또는 이상의 전압을 가지는 입력을 넣으면 어떤 값이 기록되는가? 사람의 귀에서도 그런 일이 발생하는가? 음성 카드와 사람의 입력 가능 범위에는 어떤 차이가 있는가?
Mic 단자의 경우 자체 amplifier가 존재하기 때문에 상당히 낮은 신호도 잡아낼 수 있지만, Line in의 경우에는 신호가 작을 경우 신호를 입력 받지 못할 가능성이 있다. 이는 사람의 귀에서 청소골의 역할과 비슷한 맥락임을 알 수 있는데, 사람의 귀는 청소골이 amplifier로써 작용하여 작은 소리에도 민감하게 반응할 수 있다. 반면에 크기가 큰 신호를 입력할 경우에는 회로에 너무 많은 전류가 인가되어 회로의 고장을 야기할 수 있다. 이 점 또한 사람의 귀와 비슷한데, 사람의 귀의 경우에는 고막이 공기압을 견디지 못하고 찢어지는 경우가 발생할 수 있고, 청세포 또한 너무 큰 자극에 노출될 경우 손상될 가능성을 가지고 있다. 반면 귀의 경우에는 음성 카드와 다른 특성을 가지는데 그것은 상황에 따라서 귀의 gain이 변화할 수 있다는 점이다.
B. 자음 인식의 경우도 모음 인식에서 선택한 윈도우 크기와 종류가 좋은 인식 성능을 내는 데 유리할 것인가?
자음의 경우 모음에서 선택했던 window의 크기와 종류가 그대로 적용될 경우 큰 효율을 내지 못할 가능성이 있다. 첫 번째 이유는 일반적으로 자음의 길이가 모음의 길이에 비해서 현저히 짧다는 점을 들 수 있다. 자음은 비교적 짧은 길이를 가지기 때문에 모음에서 사용한 window의 크기를 그대로 사용할 경우 시간 해상도가 너무 낮아서 분석에 어려움이 있을 수 있다. 두 번째로 상당히 규칙적이고 변화가 적은 형태를 가지는 모음과는 달리 자음은 비교적 불규칙하고 변화가 많다. 따라서 모음에 사용한 window의 형태가 자음에서는 효율적이지 않을 가능성이 있다. 따라서 좋은 window를 결정하기 위해서는 자음에 대해서도 따로 알맞은 window를 결정하는 과정이 필요하다.
C. 멜 스펙트럼은 화자 인식에 좋은 feature라고 할 수 있는가?
화자인식을 위해서 수행한 여러 가지 테스트 중에서 발성을 변화시켜서 녹음을 하였을 때에 Mel spectrum에서의 주파수 대역의 변화가 STFT에서의 변화보다 더 뚜렷하게 나타나는 것을 확인할 수 있었다. 따라서 화자의 발음 형태에 중점을 두는 화자 인식의 경우 Mel spectrum이 알맞게 적용될 수 있을 것이라고 예상할 수 있다. 다만 화자인식은 일반적으로 굉장히 많은 종류의 set에서 단 하나만의 결과를 도출해 내어야 하는 과정이기 때문에 상당히 좋은 해상도가 필요한데, 이에 대해서는 Mel spectrum이 STFT와 같은 feature들 보다 불리한 특성을 가지는 것으로 생각되었다. 따라서 Mel spectrum을 적절히 사용하기 위해서는 해상도를 개선하기 위한 가공이나 노력이 필요할 것으로 보인다.
참고 자료
1) 바이오 계측실험 실험서
2) 바이오 계측기기 매뉴얼