A Study on the Korean Conversation Speech Level and Spectrum in Sound-Treated Environment
Article information
Trans Abstract
Purpose
Several studies have reported the differences between Korean and other countries’ speech in long-term average speech spectrum (LTASS) and band importance function. Authors tried to identify the conversational speech level, the resulting spectrum, and the LTASS for Korean. The purpose of this study was to support the production of a Korean-type hearing aid fitting formula to effectively improve the sound quality of hearing aids and the communication abilities with hearing aids, and to standardize the sound stimuli required to measure the performance of hearing aids.
Methods
A total of 73 participants with normal hearing and with no specific voice and language deficits was voluntarily recruited from capital, Gyeongsang and Jeolla areas. The conversational speech level was measured by vocalizing ‘soft,’ ‘moderate,’ ‘raised,’ and ‘loud’ at a distance of 1.0 m from the speaker. And LTASS was measured by vocalizing it at a distance of 0.2 m from the speaker.
Results
There was a difference in the mean of males and females in the conversation level, but no significant regional differences were shown. The conversational speech level corresponding to 30th, 65th, and 99th percentiles was 59.67, 64.74, and 79.07 dB sound pressure level, respectively. And the speech spectrum of 30th, 65th, and 99th percentile and LTASS showed in different forms from the international speech test signal.
Conclusion
The results of this study should help to calculate the Korean type hearing aid fitting formula and should be used as the basic data to determine the characteristics of the sound stimuli when measuring the performance of the hearing aid.
INTRODUCTION
대화음레벨(conversational speech level)이란 서로 마주하여 이야기를 주고받을 때 나타나는 어음의 음압레벨(sound pressure level, SPL), 장기평균어음스펙트럼(long-term average speech spectrum, LTASS)은 특정 기간(시간) 동안의 1 또는 1/3 옥타브 주파수에서 평균 SPL 또는 이득을 의미하며, 이는 평균화된 어음의 정보를 제공한다. 청각학에서의 대화음레벨과 LTASS는 주로 난청인이 착용하는 보청기의 이득 산출 또는 보청기의 전기음향적 조절(Byrne & Dillon, 1986; Byrne et al., 2001; Cornelisse et al., 1995; Lee & Kim, 2011), 보청기의 성능 측정(IEC, 2005; 2012) 등에 사용한다.
청력역치레벨(hearing threshold level)에 따른 보청기의 이득을 산출하기 위해서는 보청기적합공식(hearing aid fitting formula)을 이용하는 것이 효과적이다. 보청기적합공식에서 대화음레벨 그리고 LTASS를 이용한 비선형의 보청기적합공식을 개발한 해외의 사례를 살펴보면 National Acoustic Laboratories’ nonlinear fitting procedure, version 1(NAL-NL1; National Acoustic Laboratories, Chatswood, Australia)은 1/2 옥타브 주파수에서 Byrne et a l.(1994)의 LTASS를 기준으로 입력 SPL에 대한 이득량을 계산하였다(Byrne et al., 2001). 그리고 t he desired s ensation level i nput/output (DSL I /O)(Scollie et al., 2005)은 쾌적강도레벨(most comfortable level), 불쾌강도레벨(uncomfortable level), 그리고 LTASS를 고려하여 보청기적합공식을 도출하였으며, 또한 유아, 어린이 및 성인의 최신 보청기 사용을 위한 version 개정을 위해 Pearsons et al.(1977)의 연구를 참고하였다. 한국 연구의 경우 Hallym Audiology Institute-version 1(Jin et al., 2017)은 보청기적합공식 개발 시 한국어의 LTASS와 대역중요함수(band importance function), 역동 범위(dynamic range)와 같은 언어의 음향 및 언어적 특성을 고려하였으며, Lee & Kim(2011)은 대화음레벨과 음량 범주 위치 확인 시, 한국어음의 평균 SPL, LTASS 및 청력역치레벨에 따른 쾌적강도레벨의 변화를 통해 이득을 계산하였다.
보청기의 성능 측정 시 대화음레벨과 LTASS의 활용 사례를 살펴보면 국제전기기술위원회(International Electrotechnical Commission, IEC)에서는 보청기의 이득 측정 시 30, 65, 99 퍼센타일(percentile)에 대한 대화음레벨과 이에 따른 어음스펙트럼을 이용한다(IEC, 2012). Holube et al.(2010)은 성능 측정의 표준화를 위해 Byrne et al.(1994)의 연구 방법을 바탕으로 다양한 국가의 어음 표준화를 시도하여 국제어음시험신호(international speech test signal, ISTS)를 개발하였다.
대화음레벨 및 LTASS에 대한 연구를 살펴보면 대화음레벨은 Pearsons et al.(1977)이 실제 대화 시 소음 상황에서 대화가 적절하게 가능한지를 확인하기 위해 다양한 상황에서 배경소음 및 대화음레벨을 1.0 m에서 녹음 및 분석하였다. 그중 무반향실측정에서는 가벼운(casual), 보통의(normal), 조금 큰(raised), 큰(loud), 그리고 외치는(shout) 5개 범주를 사용하였으며, 연구 결과 가벼운 대화음레벨과 큰 대화음레벨 간에는 대략 30 dB SPL의 차이가 나타났지만 5개의 각 범주 간의 차이는 5에서 12 dB SPL까지 다양하게 나타났다. 또한 NAL-NL1, DSL I/O 보청기적합공식 도출 시 사용된 LTASS는 Byrne et al.(1994)이 언어에 따른 보청기의 이득 산출 등에 사용하기 위해 13개의 언어(영어, 스웨덴어, 덴마크어, 독일어, 프랑스어, 일본어, 광둥어, 표준 중국어, 러시아어, 웨일스어, 스리랑카어, 베트남어, 아랍어)를 0.2 m 거리에서 녹음한 후 LTASS를 분석하였다. 분석 결과 4,000 Hz 이상에서 각 국가 언어의 강도에 차이가 나타났지만 그 차이는 무시할 수 있다고 하였다. 그러나 상기의 연구에서는 한국어의 LTASS를 확인할 수 없었다. 이에 따라 Jin & Lee(2010)는 Byrne et al.(1994)이 보고한 LTASS의 보편성의 여부를 검증하고자 하였으나 결과적으로 한국어와 영어의 LTASS 특성이 크게 다르지 않음을 확인하였다. 하지만 Byrne et al.(1994)의 연구와 비교해 상대적으로 화자 어음 수가 적어 지속적인 자료 수집을 통해 화자 성별 및 화자 연령에 따른 LTASS의 비교 연구가 이루어져야 한다고 보고하였으며, Moradi et al.(2014)의 연구 또한 화자 성별에 따른 LTASS를 확인하기 위해서는 더 많은 대상자 수가 필요하다고 보고하였다. 그러나 Lee et al.(2008)과 Noh & Lee(2012) 연구에서는 한국어의 LTASS와 영어음의 LTASS의 차이가 나타난다고 보고하였으며, Jin et al.(2016) 연구에서는 영어와 한국어의 대역중요함수에서 한국어의 역동 범위가 저주파수에서 영어의 역동 범위보다 좁다는 의견을 제시하였다.
상기의 연구를 종합해 보면 특정 국가에서 사용하는 보청기의 전기음향적 조절 그리고 성능 측정을 위해서는 해당 국가언어의 대화음레벨 및 LTASS를 확인하는 것은 매우 중요하다. 현재 한국의 경우에는 대부분 유럽, 미국, 호주 등의 영어권에서 개발한 보청기와 보청기적합 소프트웨어를 수입하여 사용하고 있다. 이에 따라 Lee & Kim(2009)은 서구에서 개발한 보청기적합공식을 사용하는 경우 한국 난청인의 심리음향 및 언어적인 특성에 맞지 않아 한국 난청인이 사용하는 보청기의 전기음향 조절에 지장을 초래할 수 있다고 하였다.
이에 본 연구에서는 한국어를 모국어로 하는 건청 성인 남녀의 발성 방법에 따른 대화음레벨과 LTASS를 방음실 환경에서 확인하고자 하였다. 구체적인 내용은 첫째, 30, 65, 99 퍼센타일에 해당하는 대화음레벨과 이에 따른 스펙트럼을 확인하고자하였다. 둘째, 보통 크기로 발성한 한국어음에 대한 LTASS를 확인하고자 하였다. 한국어 대화음레벨과 스펙트럼 그리고 LTASS의 확인을 통하여 한국 난청인이 착용하는 보청기의 음질 및 의사소통능력을 효과적으로 개선하기 위한 보청기적합공식의 산출과 보청기의 성능 측정에 필요한 신호음의 표준화에 도움을 주고자 하였다.
MATERIALS AND METHODS
연구 대상
대화음레벨과 LTASS를 확인하기 위한 대상자는 한국어를 모국어로 사용하는 한국인으로 평균 연령 25.9세(표준편차: 7.27세)의 성인 73명(남자 25명, 여자 48명)이었다. 대상자는 육안 관찰 시 외이도 및 고막에 이상소견이 없고 한국어판 음성장애지수(Yun, 2007)를 통해 음성 및 언어적 특이사항이 없으며, 순음기도청력검사에서 0.25에서 8.0 kHz의 청력역치레벨이 25 dB HL 이하, 단어인지도는 45 dB HL에서 90% 이상인 피검자를 대상으로 하였다. 그리고 대상자는 수도권 15명, 경상도 36명 및 전라도 22명으로 총 73명을 모집하였다.
모집단의 산출 근거
본 연구에 필요한 최소 표본의 수를 알아내기 위해 20명의 예비실험 데이터를 추출하여 아래의 식(Scheaffer et al., 2012)으로 계산하였다.
상기의 식에서 신뢰도 100 (1-α)%일 때, n은 필요한 표본의 크기, N은 모집단의 크기, s는 표준편차, d는 오차한계이며 zα는 표준 정규분포의 제100(1-α)번째 퍼센타일이다. 예비실험 데이터 분석으로 얻은 표준편차 s = 2.84를 20세 이상 인구를 모집단으로 할 때, 모집단 크기 N = 36,765,374명(KOSIS, 2019), 오차한계 d = 0.7(dB), 신뢰도 95%에서 z0.025 = 2를 사용하여 계산하면 필요한 최소 표본 수(n)는 65.84로 나타났다(Equation 1 참조). 이에 근거하여 본 연구에서는 총 73명에 대한 피검자의 데이터를 구하였다.
연구 장비
외이도 및 고막의 이상 유무는 이경 검사기 MD SCOPE MS101(MD SCOPE, New Taipei, Taiwan), 음성 및 언어적 특이사항 확인은 한국어판 음성장애지수(Yun, 2007)를 사용하였다. 순음 및 어음청각검사는 GSI AudioStar P ro (Grason Stadler Inc., Eden Prairie, MN, USA), GSI 61(Grason Stadler Inc.), 그리고 헤드폰은 모두 TDH-49(Telephonics, Farmingdale, NY, USA)를 사용하였으며, 단어인지도검사는 한국 표준단음절어표(Korean standard monosyllabic word lists)를 사용하였다. 대화음레벨 및 LTASS는 A 가중치로 1분간 측정했을때 3 0 dB LAeq 이하의 소음레벨이 나타나는 방음실(남부대학교, 부산가톨릭대학교, 한림국제대학원대학교)에서 측정하였으며, 읽기 자료는 읽기 쉬우며 반복 구절이 없고, 대화 문장이 많은 한국 전래 동화책 『한글학교 학생용 동화로 배우는 한국어(Overseas Korean Education Promotion Foundation, 2006)』를 선택하였다. 대화음레벨 측정은 소음계 Hand-held analyzer type 2250-L (Bru¨el & Kjær, Nærum, Denmark)로 실험 전에 한국표준과학연구원에서 교정을 마친 후 사용하였다.
연구 절차
대상자의 배치
대화음레벨과 어음스펙트럼 측정은 Byrne et al.(1994)과 그리고 Peasrons et al.(1977)이 사용한 방법을 이용하였다. 대상자의 배치는 첫째, 대상자를 의자에 앉힌 후 읽기 자료를 소음계와 화자의 입보다 최대한 아래에 위치하도록 들게 하였으며, 소음계는 입의 수평면 아래 45°에 배치하였다. 이때 입과 소음계의 거리는 1.0 m를 유지하도록 하였다. 둘째, LTASS는 Byrne et al.(1994)의 방법을 이용하였다. 대상자를 의자에 앉힌 후 소음계를 입의 수평면 아래 45°에 배치하였으며, 입과 소음계의 거리는 0.2 m였으며, 읽기 자료는 1.0 m 방법과 마찬가지로 대상자가 들게 하였다.
대화음레벨과 LTASS의 측정
대화음레벨과 30, 65, 99 퍼센타일에 대한 어음스펙트럼 측정은 첫째, 대상자에게 연구 목적과 실험 방법을 설명한 후 동화책의 여러 내용 중 대상자가 읽을 동화책 내용 하나를 선택하게 하였다. 둘째, 대상자의 목을 풀고 자연스러운 발성을 위해 동화책 내의 2 문장 이상을 읽게 하였다. 셋째, 책을 읽는 도중 틀린 단어가 있어도 수정하지 않고 계속 읽을 것을 지시하였으며, 대상자가 생각하는 일상적인 대화할 때의 크기를 기준으로 ‘작게’, ‘보통’, ‘조금 크게’, ‘크게’ 순으로 발성하게 하여 측정하였다. 넷째, LTASS는 대화음레벨과 어음스펙트럼 측정 방법과 동일하지만, 대상자가 생각하는 일상적인 대화를 할 때처럼 ‘보통 크기’로만 발성하게 하여 측정하였다. 대화음레벨과 LTASS는 총(total) SPL 및 1/3 옥타브 주파수에서 LZeq (dB SPL)로 측정하였다.
결과 분석
성별, 지역별, 발성 방법에 따른 차이는 상호작용을 포함하여 삼원배치 분산분석모형으로 분석한 결과 2차 이상의 상호작용은 유의하지 않을 경우 상호작용은 모두 오차 항으로 풀링(pooling)하여 주 효과만 포함된 삼원배치 분산분석을 사용하였다. 어음스펙트럼은 1/3 옥타브 주파수에서 30, 65, 99 퍼센타일에 해당하는 SPL 및 어음스펙트럼을 구하였다. ‘보통’ 크기로 발성한 남녀 LTASS의 차이는 독립표본 t-검정(independent t-test)을 통해 확인하였다. 본 연구의 통계 분석은 SPSS Version 25(IBM Corp., Armonk, NY, USA)를 사용하였다.
RESULTS
본 연구에서는 한국형 보청기적합공식의 산출, 효과적인 보청기의 조절을 위해 경기도를 포함한 서울, 경상도 및 전라도에 거주하는 남녀 화자가 1.0 m의 거리에서 발성하는 방법(‘작게’, ‘보통’, ‘조금 크게’, ‘크게’)에 따른 각각의 대화음레벨 그리고 30, 65, 99 퍼센타일에 해당하는 대화음레벨 및 어음스펙트럼을 확인하였다. 그리고 성능 측정에 필요한 신호음의 표준화에 도움을 주기 0.2 m 거리에서 ‘보통’ 크기로 발성하는 한국어음의 LTASS를 확인하였다.
대화음레벨과 어음스펙트럼
대화음레벨
성별, 지역별, 발성 방법에 따른 대화음레벨의 차이를 분석해본 결과, 성인 남성의 평균 대화음레벨은 여성의 평균 대화음레벨보다 3.69 dB 높았으며(t = 6.16, p < 0.001), 서울과 경기, 경상, 전라 지역별 대화음레벨의 평균(표준편차)은 각각 63.62(5.39), 62.93(5.42), 62.45(5.52) dB SPL로 통계적으로 유의미한 차이는 없었다(F = 0.832; p = 0.436). 성인 남녀가 1.0 m에서 ‘작게’, ‘보통’, ‘조금 크게’ 및 ‘크게’ 발성할 때 통계적으로 유의한 차이가 나타났다(F = 164.15, p < 0.000). Table 1에 유의한 차이가 있는 성별 및 발성 방법별 평균(표준편차)을 요약하였다.
성별, 지역별, 발성 방법에 따른 차이를 상호작용(interaction)을 포함하여 삼원배치 분산분석모형으로 분석한 결과 2차 이상의 상호작용은 유의하지 않았으므로[지역 × 발성 방법(p = 0.737), 지역 × 성별(p = 0.070), 성별 × 발성 방법(p = 0.859), 성별 × 지역 × 발성 방법(p = 0.906)] 상호작용은 모두 오차 항으로 풀링하여 주 효과만 포함된 삼원배치 분산분석을 사용하였다. 분석결과는 Table 2와 같이 성별 및 발성 방법에 따른 차이는 유의하였으나 지역에 따른 차이는 유의하지 않았다.
30, 65, 99 퍼센타일의 대화음레벨과 어음스펙트럼
IEC(2012)에서 제시한 30, 65, 99 퍼센타일, 즉 한국어 대화음의 ‘작은’, ‘보통’, ‘큰’ 대화음레벨은 각각 59.67, 64.74, 79.07 dB SPL로 나타났다(Figure 1).
그리고 Figure 2에 IEC(2012)에서 제시한 것과 마찬가지로 여성 대화음레벨의 30, 65, 99 퍼센타일에 해당하는 SPL을 0.06 kHz에서 16.0 kHz의 주파수 범위에서 나타내었다. Figure 2에서 30, 65, 99 퍼센타일의 스펙트럼은 0.25 kHz에서 0.40 kHz 사이에서 최대치를 나타냈으며, 최대치를 기준으로 주파수가 낮아지거나 높아질수록 SPL이 감소하는 형태를 나타내었다.
DISCUSSIONS
대화음레벨과 어음스펙트럼
IEC(2005; 2012)에서는 보통 크기의 대화음레벨을 65 dB SPL로 명시하고 있다. 이에 따라 IEC(2012)에서는 보청기의 성능 측정, 실이 측정 시 ‘보통 크기’에 대한 어음을 제시할 때 65퍼센타일에 해당하는 ISTS의 스펙트럼을 제시하도록 규정하고있다. 본 연구에서 한국인이 1.0 m 거리에서 발성하는 대화음레벨에서 ‘보통 크기’로 발성하는 평균 대화음레벨은 60.75(표준편차, 3.06) dB SPL로 나타났으나 ‘작게’, ‘보통’, ‘조금 크게’ 및 ‘크게’ 발성할 때 65 퍼센타일은 64.74 dB SPL로 IEC(2005; 2012)와 비슷한 수치를 나타냈다.
대화음레벨의 범위를 IEC(2012)에서는 30 퍼센타일인 55 dB에서 99 퍼센타일인 80 dB SPL로 정하여 보청기의 성능 측정 및 보청기의 조절에 이용하고 있다. 그러나 본 연구에서 한국어 대화음레벨의 30 퍼센타일과 99 퍼센타일의 각각 59.67 dB, 79.07 dB SPL로 나타나 한국어의 30 퍼센타일은 IEC(2012)에 비해 4.67 dB이 더 높게 나타났다. 이러한 차이는 비선형 증폭시스템에서의 압축역치(compression threshold)의 설정 등 보청기적합공식의 산출에 영향을 줄 수 있다.
Figure 4에서 여성이 녹음한 한국어와 IEC(2012)에서 제시한 ISTS의 30, 65, 99 퍼센타일에 대한 스펙트럼을 0.25 kHz에서 16.00 kHz까지 비교해 보았다. 어음스펙트럼 역시 30 퍼센타일에서 많은 차이를 나타냈는데, 특히 에너지가 강한 0.25 kHz 이하에서 많은 차이를 나타냈다. 그리고 65와 99 퍼센타일에서도 많은 주파수에서 어음스펙트럼의 차이를 나타냈다. 각 퍼센타일에 대한 어음스펙트럼의 차이 또한 비선형 증폭기의 압축역치, 압축비율 등 보청기적합공식의 산출, 보청기의 성능 측정에 필요한 신호음의 제시 SPL, 스펙트럼 등의 특성에 영향을 줄 것으로 보인다.
한국 남녀가 발성하는 대화 음레벨에서 ‘보통 크기’로 발성했을 때 평균 대화음레벨은 61.74 dB SPL과 60.23 dB SPL로 차이가 나타나지 않았다. 그러나 발성 방법에 따른 전체 평균에서는 남성이 64.72 dB SPL, 여성이 61.03 dB SPL로 남성이 여성에 비해 3.69 dB이 높게 나타났다. 남성의 평균 대화음레벨이 더 높게 나타난 것은 폐활량이 더 큰 남성이 큰 소리로 발성했을 때의 대화음레벨이 높게 나타났기 때문인 것으로 보인다.
LTASS
한국 남녀가 0.2 m에서 ‘보통 크기’로 발성했을 때의 LTASS에서 남성은 0.13 kHz 이하의 주파수에서 여성에 비해 SPL이 높게 나타나 Byrne et al.(1994), Noh & Lee(2012)의 연구와 일치성을 나타냈다. 그리고 한국 여성의 LTASS는 0.25 kHz에서 16.0 kHz까지의 주파수 범위에서 IEC(2012)에서 제시한 형태와 다르게 나타났다. Table 3에서 한국어의 평균 LTASS를 ISTS와 일표본 t-검정을 통해 확인했을 때 1.00, 2.00, 2.50, 3.15, 4.00, 5.00, 6.30 kHz를 제외한 모든 1/3 옥타브 주파수에서 차이가 나타났다(p < 0.05). IEC(2012)에서는 ISTS 개발 시 Byrne et al.(1994)의 연구 결과를 국제 LTASS를 기준으로 여과(filtering)하여 ISTS와 LTASS 차이를 1 dB 미만으로 제한하고 여과한 데이터를 음절 단위로 분절하여 SPL을 산출하는 과정을 거쳤다(Holube, 2010). 따라서 IEC(2012)에서 명시한 ISTS는 본 연구와의 직접적인 비교에서 한계가 있음에도 불구하고 한국어음의 특성을 반영하지 못하는 것으로 볼 수 있다.
1.0 m에서 발화한 한국인의 대화음레벨에서 30, 65, 99 퍼센타일은 59.67, 64.74, 79.07 dB SPL로 나타나 30 퍼센타일에 해당하는 대화음레벨은 IEC(2012)에서 제시한 55 dB SPL과 차이가 있음을 확인하였다. 그리고 한국어 30, 65, 99 퍼센타일의 어음스펙트럼과 LTASS의 형태 또한 IEC(2012)와 차이가 있음을 확인하였다. 이 결과는 향후 한국 난청인이 착용하는 보청기의 음질 및 의사소통능력의 개선을 위한 보청기적합공식의 산출, 보청기 성능 측정을 위한 신호음의 표준화에 도움을 줄 수 있을 것으로 생각한다.
향후의 연구에서는 소음이 존재하는 다양한 상황에서의 실제 대화음레벨 및 어음스펙트럼을 체계적으로 측정하여 분석한다면 난청인의 보청기적합 및 신호음의 표준화에 보다 유용한 자료로 사용할 수 있을 것이다.
Acknowledgements
Thanks to participants Catholic University of Pusan, Hallym University of Graduate Studies Nambu University for cooperation in data collection.
Notes
Ethical Statement
This study was approved by the Institutional Review Board of Hallym University of Graduate Studies (IRB # HUGSAUD 631278).
Declaration of Conflicting Interests
There are no conflict of interests.
Funding
This research was completed while being supported by National Research Foundation of Korea (2018R1A2B6001986).
Author Contributions
K.L. designed experimental procedures. Y.H. collected and analyzed data. Y.H. and K.L. wrote the paper. Y.H. and K.L. discussed the results together and implications at each data.