Comparisons of 4-Point GRBAS, 7-Point-GRBAS, and CAPE-V for Auditory Perceptual Evaluation of Dysphonia
Article information
Abstract
Purpose
The GRBAS (grade, roughness, breathiness, asthenia, strain) scale, a 4-point scale, has been most widely used for judging auditory-perceptual severity for dysphonia. However, in current clinical practice, sometimes a more fragmented 0.5 scheme is being used if the original GRBAS scale is ambiguous to assess. Thus, the aim of the present study was to compare the dysphonia severity using the three auditory-perceptual evaluation tools, 4-point, 7-point GRBAS scale, and CAPE-V and provide the information regarding differentiation of perceptual severity and acoustic correlations.
Methods
Voice samples for sustained vowel and connected speech were obtained from 101 dysphonic patients. Auditory-perceptual assessments of dysphonia severity were performed by two certified experienced speech-language pathologists specializing in voice disorders using the grade of a 4-point and a 7-point GRBAS, OS of CAPE-V and also were compared with cepstral measures [cepstrum peak prominence (CPP), low/high spectral ratio].
Results
OS and G of inter-rater reliability of dysphonia using CAPE-V and 4-point GRBAS scales were good (ICC > 0.800) while G of 7-point GRBAS was less strong (ICC > 0.681) than OS of CAPE-V and G of 4-point GRBAS scale. The highest correlation with CPP was the OS of CAPE-V in both vowel and connected speech, while L/H ratio showed low correlation with dysphonia severity. The OS of CAPE-V in vowel and connected speech differed significantly in G of both GRBAS scales. On the 4-point GRBAS scale, CPP showed only the difference between G1-G2, G2-G3 groups in /a/ vowel, whereas in the connected speech, the difference between G0-G1, G1-G2, and G2-G3 groups was relatively differentiated. Meanwhile, on a 7-point GRBAS scale, CPP showed only differences between G1.5-G2 groups in sustained vowel, while CPP showed no differences between G0-G0.5, G0.5-G1, G1-G1.5, G2-G2.5, and G2.5-G3 groups respectively in connected speech.
Conclusion
7-point GRBAS scale showed a higher correlation with CPP measures than the original GRBAS, but reduced the discrimination of dysphonia severity compared to the 4-point GRBAS scale. Consequently, modified 7-point GRBAS scale could be useful as a clinically-perceptual evaluation tool, along with the original GRBAS scale and CAPE-V.
INTRODUCTION
청지각적 평가는 전통적으로 임상에서 음성장애 환자의 음성 평가 방법 중 정석(gold standard)으로 불리우는 가장 필수적인 검사로, 훈련된 임상가의 귀에 의해 평가되는 임상가 기반의 주관적인 평가이다. 청지각적 평가는 객관적 검사에서 평가할 수 없는 복잡한 음질에 대한 특성을 평가할 수 있으며, 장비를 사용하지 않고 음성장애 유무와 중증도를 평가하고(Bele, 2005; Bhuta et al., 2004), 치료의 효과를 예측하는 데도 중요하게 사용된다(Ma & Yiu, 2006).
국내 음성 평가에 관한 임상가 참여 전국 조사 결과, 현재 음성 평가 업무를 담당하고 있는 국내 음성언어재활사 중 응답자 100%가 정기적으로 음성 평가 시 청지각적 평가를 시행하고 있으며, 이 중 grade, roughness, breathiness, asthenia, strain (GRBAS) (Hirano, 1981)척도나 Consensus Auditory-Perceptual Evaluation of Voice (CAPE-V) (Kempster et al., 2009)를 사용하는 것으로 나타났다(Choi, 2013). 하지만 검사자의 경험과 훈련 정도에 따라 검사자 간 및 검사자 내 신뢰도에 문제가 제기되어 왔다(Eadie & Baylor, 2006).
한편, 음성을 청지각적으로 평정할 때 척도(scale)를 사용하게 되는데, 서열척도(ordinal scale, ORD)나 등간격척도(equalappearing interval scale, EAI), 혹은 시각적 아날로그 척도(visual analog scale, VAS)와 같은 연속 척도를 사용한다(Choi & Choi, 2009; Kreiman et al., 1993).
현재 가장 널리 사용되고 있는 대표적인 청지각적 평가 도구 중 일본음성언어의학회에서 완성된 GRBAS척도는 G (grade, 종합애성도), R (roughness, 조조성), B (breathiness, 기식성), A (asthenia, 무력성), S (strain, 긴장성)로 5개의 항목으로 이루어져 있다. 평가 척도는 서열 척도(ordinal scale)와 같은 리커트 척도를 사용하며 총 4점 척도로 0점은 정상, 3점은 가장 안 좋은 음질의 상태를 의미한다. 즉, 0은 정상, 1은 경도(mild), 2는 중도(moderate), 3은 심도(severe)를 나타낸다. 청지각적 파라미터 중 종합애성도(G)는 음질의 전체적인 인상을 나타내며, 조조성(R)은 성대 진동이 불규칙하게 나타나는 소리로 거친 소리이고, 긴장성(S)은 성대가 비정상적으로 과긴장하여 성대가 과도하게 단단하여 쥐어짜는 듯한 소리를 나타낸다. 기식성(B)은 성문폐쇄부전으로 인해 공기가 새는 소리로서 간혹 무력성과 혼돈이 올 수 있어서 구분하여 평가하여야 한다. 이러한 이유로 성대긴장부전으로 인한 연약하고 갸날픈 소리를 나타내는 무력성(A)은 CAPE-V에서는 무력성을 제외하고 음질을 평가한다. 또한, GRBAS척도는 다른 청지각적 평정 척도에 비해 검사자의 숙련도에 큰 영향을 받지 않으며, 검사자 간 신뢰도가 높아 평가가 용이하다고 보고되었다(Bhuta et al., 2004). 그 중에서도 음성의 전체적인 애성도를 평가하는 G는 객관적 음성 평가와의 상관관계가 높은 것으로 알려져 있다(Anders et al., 1988). 이에 반해 GRBAS척도는 CAPE-V와 비교했을 때 평가 항목 수가 적고, 척도도 4단계로 단조로운 구성을 가지고 있어 섬세하고 세부적인 음질 평가가 어려우며, 음도, 강도를 평가하지 못하고 음질만 평가하는 단점이 있다. 하지만, 다른 청지각적 평정 도구보다 더 빠르고 쉽게 검사가 가능하고 재현성이 뛰어나 지금까지의 청지각적 평정 중에 가장 우수하다고 평가되었다(Karnell et al., 2007; Wuyts et al., 1999).
2002년에 미국언어병리학회(American Speech-Language-Hearing Association, ASHA)에서 발표된 CAPE-V는 이전의 단점들을 보완한 청지각적 평정 도구이다. 최근 미국을 포함한 여러 국가에서 GRBAS척도를 대신하여 많이 사용하고 있으며, CAPE-V는 모음, 문장 및 자발화 샘플을 듣고 전반적인 중증도(overall severity, OS), 조조성(R), 기식성(B), 긴장성(S), 음소(pitch, P), 강도(loudness, L) 총 6개의 항목으로 이루어져 검사자가 평정하게 되어 있다. 또한, 추가로 성대프라이, 떨림, 공명, 이중 음성, 젖은 목소리, 가성 발성, 실성증, 불안정한 음도 등을 평가한 후 100 mm 선상에 표시하는 시각적 아날로그 척도(VAS)를 사용한다(Kempster et al., 2009). 즉, 0 mm(정상)부터 100 mm(가장 안 좋은 음질의 상태)까지 나타낼 수 있는 연속 척도이다. GRBAS척도는 음질만 평가가 가능한 반면, CAPE-V는 음도, 강도 및 음질을 전반적으로 모두 평가할 수 있다. 하지만, CAPE-V는 GRBAS척도에 비해 검사자 간 신뢰도가 낮은 반면, CAPE-V는 GRBAS척도에 비해 작은 차이를 감지하는 민감도가 더 높은 것으로 보고되었다(Karnell et al., 2007; Wuyts et al., 1999).
위의 청지각적 평정 척도의 단점을 보완하여 현재 임상에서는 GRBAS척도의 4점 체계로 평정하기 어려운 경우, 좀 더 세분화된 척도로서 원래의 0, 1, 2, 3의 4점 척도를 세분화하여 0 (normal), 0.5 (very mild), 1 (mild), 1.5 (mild-to-moderate), 2 (moderate), 2.5 (moderate-to-severe), 3 (severe)으로 7점 GRBAS척도를 사용하기도 한다. 하지만 임상이나 연구에서 많이 사용하고 있음에도 불구하고 아직까지 세분화된 7점 GRBAS 척도와 기존의 GRBAS척도 및 CAPE-V의 청지각적 평정에 대한 비교 연구가 이루어진 바가 없다. 따라서, 본 연구는 음성장애의 중증도를 평가하기 위하여 기존의 GRBAS척도와 7점 GRBAS 척도의 G 점수와 CAPE-V의 전반적인 중증도를 비교하여 7점 GRBAS척도의 임상적 유용성을 살펴보고자 한다.
한편, 최근 ASHA에서는 장애 음성을 평가하는 데 있어서 캡스트럼 분석 측정치를 포함하도록 권고하고 있다(Patel et al., 2018). 캡스트럼 분석은 음질을 객관적으로 평가하는 음향학적 분석 방법 중 하나로서 청지각적 평정을 보완하기 위하여 사용된다. 특히, 청지각적 평정을 위한 음성 샘플로는 모음뿐 아니라 일상생활의 음성을 가장 잘 반영하는 연속 구어의 말 과제를 함께 사용하는데 캡스트럼 분석은 모음뿐 아니라 연결 발화의 분석도 가능하며, 음성 문제가 심각한 경우에도 음질을 객관적으로 분석할 수 있다(Choi & Choi, 2014). 뿐만 아니라 캡스트럼 측정치는 모음 연장 발성 및 연결 발화 음성 표본에서 장애 음성의 중증도를 강력하게 예측할 뿐 아니라, 청지각적 평가와 높은 상관을 보인다고 하였다(Awan et al., 2010; Choi & Choi, 2014, 2016; Lowell et al., 2012; Yu et al., 2017). 따라서, 첫째, 본 연구는 모음과 연결 발화에서 기존의 4점 GRBAS척도와 7점 GRBAS척도 및 CAPE-V를 사용하여 음성장애 중증도에 대한 평가자 내 및 평가자 간 신뢰도를 비교해 보고자 한다. 둘째, 4점 및 7점 GRBAS척도와 CAPE-V에 따른 청지각적 중증도를 비교해 보고자 한다. 셋째, 청지각적 음질의 객관적 지표로 널리 알려진 켑스트럼 측정치와 청지각적 평가들 간 상관성을 살펴봄으로써 어떤 청지각적 평가 척도가 중증도를 잘 변별할 수 있는 지 살펴보고자 한다.
MATERIALS AND METHODS
연구 대상
본 연구는 목소리 문제를 주소로 내원한 환자 중 음성장애로 진단받은 환자 101명을 대상으로 하였다. 대상 환자는 후두 내시경 검사를 통해 이비인후과 전문의의 진단을 받고 음성치료사의 음성 검사를 받은 환자들로 대상 환자의 연령은 만 17~80세로 평균 연령은 47.4세였으며, 남성 25명, 여성이 76명이었다. 대상자의 정보는 Table 1과 같다.
연구 절차
음성자료 수집을 위해 소음이 통제된 이비인후과 음성검사실에서 90°로 고정된 Shure SM48-LC 다이내믹 마이크(Shure Inc., Chicago, IL, USA)를 이용하여 Computerized Speech Lab (CSL; KayPENTAX Inc., Lincoln Park, NJ, USA)의 Real Time Pitch 프로그램(Model 5121, KayPENTAX Inc.)을 사용하여 녹음하였다. 이때, 음성표본추출률(sampling rate)은 44,100 Hz, 16 bit 양자화로 하였다. 모음 연장 발성 과제는 편안하고 자연스러운 음도와 강도로 모음 /ㅏ/를 3초간 발성하도록 하였고 연속 구어 과제는 “안녕하세요? 제 이름은 ◯◯입니다.”를 평상시의 습관적인 음도와 강도로 말하도록 하였다.
청지각적 평정
청지각적 평정은 소음이 통제된 30 dB 미만의 조용한 방에서 음성장애 환자의 평가와 치료 영역의 15년 이상(평균 18.3년)인 2명의 1급 언어재활사(1명의 음성클리닉에 근무하는 언어재활사, 1명의 교수)에 의해 실시되었다. 모음 연장 발성과 연결 발화의 두 가지 음성 표본은 실험대상자의 정보 없이 WAV 형식으로 모음 파일과 연결 발화 파일에 각각 저장되었다. 청지각적 평가는 음성장애 중증도를 평가하기 위하여 음질의 중증도를 평가하는 데 널리 사용되는 GRBAS척도와 세분화된 GRBAS척도 중 G를, CAPE-V에서는 전반적 중증도(OS)를 중심으로 측정하였다. 모든 검사자는 전체 101명의 음성 샘플 총 202개(모음 101개, 연결 발화 202개)를 듣고 음성 샘플에 대한 사전 정보 없이 청지각적 평정을 실시하였으며, 모든 음성 평가는 필요한 경우 반복적으로 듣도록 허용하였다. 무작위로 배치된 모음 파일을 듣고 4점 GRBAS척도, 7점 GRBAS척도, CAPE-V를 사용하여 동시에 G 점수와 OS를 평정하였다. 그 후 연결 발화를 듣고 동일한 방법으로 청지각적 평가를 실시하였다. 반복된 청지각적 검사의 피로나 집중력의 감소를 조절하기 위하여 검사자는 30개의 샘플 평정 후 10분간 휴식 시간을 가지도록 하였다. 첫 번째 청지각적 평정에서 모든 음성 샘플에 대한 청지각적 평정을 실시하였으며, 검사자 간 일치도를 측정하기 위하여 청지각적 평정 점수들을 비교하였다. 검사자 내 신뢰도를 측정하기 위해 일주일 후 전체 샘플의 30%에 해당하는 34명의 음성 샘플 총 68개(모음 34개, 연결 발화 34개)를 무작위로 추출하여 재평가를 실시하였다. 평정 후 캡스트럼의 음향학적 상관을 비교하기 위해 판정이 일치하지 않은 음성 표본은 4점 GRBAS척도와 7점 GRBAS척도의 경우, 두 명의 언어재활사가 함께 음성을 듣고 재평정 후 최종 동의한 것을 측정치로 사용하였으며, CAPE-V는 각 평정자 측정치의 평균값을 사용하였다.
음향학적 평가
녹음된 음성 자료는 Analysis of Dysphonia in Speech and Voice (ADSV, Model 5109; KayPENTAX Inc.)의 프로그램을 사용하여 캡스트럼 피크 현저성(cepstrum peak prominence, CPP), 저주파수 대 고주파수 스펙트럼 에너지 비율(low/high spectral ratio, L/H ratio)을 측정하였다. 모음 연장 발성의 분석은 /ㅏ/ 모음을 3초간 발성한 음성 표본의 처음과 끝부분의 50 ms를 제외한 구간 중 2초를 분석하였다. 연결 발화는 대상자의 이름을 넣어 “안녕하세요? 저는 대구광역시에 사는 ◯◯◯입니다.”를 사용하였으며, 이름과 쉼 구간은 분석에서 제외하였다.
통계 분석
SPSS (Statistics Package for Social Science version 19.0, IBM Corp., Armonk, NY, USA)를 이용하여 통계 분석을 실시하였다. /ㅏ/ 연장 모음 및 연결 발화에 대한 4점 GRBAS척도의 G 점수와 7점 GRBAS척도의 G 점수 및 CAPE-V의 전반적 중증도(OS)의 검사자 내 및 검사자 간 신뢰도를 살펴보기 위하여 급내상관계수(intraclass correlation coefficients, ICCs)를 측정하였다.
모음 연장 발성과 연결 발화의 4점 GRBAS척도의 G 점수와 7점 GRBAS척도의 G 점수의 중증도 집단 간 CAPE-V의 OS 평균 점수의 차이를 살펴보기 위하여 일원분산분석(one-way analysis of variance)을 각각 실시하였다. 집단 간 차이를 살펴보기 위하여 사후 검정을 실시하였으며, 유의 수준은 Bonferroni 방법으로 교정하여 4점 GRBAS척도 집단은 0.0125, 7점 GRBAS척도 집단은 0.007로 하였다. 또한, 모음 연장 발성과 연결 발화의 4점 GRBAS척도와 7점 GRBAS척도의 중증도 집단(G) 및 CAPE-V의 중증도 집단(OS) 간 캡스트럼 측정치의 차이를 살펴보기 위하여 일원분산분석을 실시하였다. 집단 간 차이를 살펴보기 위하여 사후 검정을 실시하였으며, 위와 동일한 방법으로 유의 수준을 검증하였다. 캡스트럼 측정치와 청지각적 분석치 간 상관성을 살펴보기 위하여 스피어만 상관분석을 실시하였으며, 통계적 유의성 검증은 0.05로 하였다.
RESULTS
검사자 내 및 검사자 간 신뢰도
두 명의 검사자 내에서 청지각적 평정의 급내상관계수는 Table 2와 같다. 4점 GRBAS척도의 G는 /ㅏ/ 모음(ICC = 0.887~0.941)과 연결 발화(ICC = 0.928~0.947)에서 강한 상관관계를 보였으며, 7점 GRBAS척도의 G는 /ㅏ/ 모음과 연결 발화는 각각 0.828~0.883, 0.896~0.901로 비교적 높은 상관관계를 나타내었다. 이와 마찬가지로, CAPE-V의 OS 점수는 /ㅏ/ 모음(ICC = 0.899~0.948)과 연결 발화(ICC = 0.897~0.909)에서 모두 비교적 높은 상관성을 나타내었다(p < 0.001).
한편, 모음과 연결 발화에 대한 평가자 간 일치도는 CAPE-V는 OS의 급내상관계수는 0.897~0.921로 강한 상관성을 보였다. 반면, 7점 GRBAS척도의 G는 0.681~0.731로 CAPE-V의 OS보다는 낮은 중간 정도의 일치도를 보였으며, 4점 GRBAS척도의 G는 중간(ICC = 0.800, 모음)에서 비교적 높은 일치도(ICC = 0.878, 연결 발화)를 보였다(Table 3).
4점 GRBAS척도 vs. 7점 GRBAS척도에 따른 청지각적 평정
4점 GRBAS척도와 7점 GRBAS척도를 사용하여 모음과 연결 발화에 대한 청지각적 평정 결과는 Table 4와 같다.
모음의 경우, 4점 GRBAS척도에서는 G0 (정상)은 27명, G1(경도)은 37명, G2 (중도)는 25명, G3 (심도)은 12명이었다. 한편, 7점 GRBAS척도에서는 G0 (정상)은 13명, G0.5 (매우 경도)는 26명, G1 (경도)은 17명, G1.5 (경중도)는 17명, G2 (중도)는 13명, G2.5 (중심도)는 8명, G3 (심도)은 7명이었다.
연결 발화의 경우, 4점 GRBAS척도에서는 G0 (정상)은 26명, G1 (경도)은 40명, G2 (중도)는 24명, G3 (심도)은 11명이었다. 한편, 7점 GRBAS 척도에서는 G0 (정상)은 29명, G0.5 (매 경도)는 18명, G1 (경도)은 16명, G1.5 (경중도)는 12명, G2 (중도)는 12명, G2.5 (중심도)는 10명, G3 (심도)는 4명이었다.
4점 GRBAS척도와 7점 GRBAS척도에 따른 CAPE-V 점수
모음의 4점 GRBAS척도 및 7점 GRBAS척도의 G 점수와 CAPE-V의 OS (전반적 중증도)의 점수 평균은 Table 5, 6과 같다.
모음 연장 발성에서 4점 GRBAS척도의 CAPE-V의 ‘OS’ 점수는 점수는 G0 (n = 27)은 6.02 ± 4.54 mm, G1 (n = 37)은 15.67 ± 8.44 mm, G2 (n = 25)는 33.02 ± 14.4 mm, G3 (n = 12)은 82.50 ± 18.8 mm였으며, 일원분산분석 결과, CAPE-V의 OS값은 G 점수에 따라 유의한 차이를 보였으며[F(3, 97] = 93.34, p < 0.001], Bonferroni 사후 검정 결과 G0-G1 (p = 0.004), G1-G2 (p < 0.001), G2-G3 (p < 0.001) 간에 모두 유의한 차이를 보였다(Table 5, Figure 1).
7점 GRBAS척도의 G 척도 점수에 따른 CAPE-V OS 점수는 7점 GRBAS척도의 경우, G0 (n = 13)은 2.69 ± 3.54 mm, G0.5 (n = 26)는 9.40 ± 4.55 mm, G1 (n = 17)은 13.62 ± 5.41 mm, G1.5 (n = 17)는 24.68 ± 5.52 mm, G2 (n = 13)는 35.69 ± 2.77 mm, G2.5 (n = 8)는 61.63 ± 13.02 mm, G3 (n = 7)은 95.79 ± 4.19 mm였다. G 점수의 중증도 집단 간 CAPE-V의 OS 평균 점수의 차이를 살펴보기 위하여 일원분산분석을 실시한 결과, 집단 간 유의한 차이를 보였으며[F(6, 94) = 324.52, p < 0.001], Bonferroni 사후 검정 결과 G1-G1.5 (p < 0.001), G1.5-G2 (p < 0.001), G2-G3 (p < 0.001) 간에 유의한 차이를 보였으나, G0-G0.5 (p = 0.015)와 G0.5-G1 (p = 0.397)은 유의한 차이를 보이지 않았다(Table 6, Figure 1).
한편, 연결 발화에 대한 4점 GRBAS 척도의 G 점수와 7점 GRBAS척도의 G 점수에 따른 CAPE-V OS의 점수 평균은 Table 5, 6에 나타내었다. 4점 GRBAS척도의 경우, G0 (n = 26)의 2.63 ± 3.94 mm, G1 (n = 40)은 10.99 ± 8.39 mm, G2 (n = 24)는 31.65 ± 12.34 mm, G3 (n = 11)은 80.68 ± 12.99 mm였으며, 일원분산분석 결과, CAPE-V의 OS값은 G 점수에 따라 유의한 차이를 보였으며[F(3, 97) = 212.45, p < 0.001], Bonferroni 사후 검정 결과 G0-G1 (p = 0.003), G1-G2 (p < 0.001), G2-G3 (p < 0.001) 간에 모두 유의한 차이를 보였다(Figure 2). 7점 GRBAS척도의 경우, G0 (n = 29)은 1.91 ± 2.89 mm, G0.5 (n = 18)는 7.61 ± 3.23 mm, G1 (n = 16)은 12.81 ± 5.36 mm, G1.5 (n = 12)는 23.42 ± 7.47 mm, G2 (n = 12)는 36.92 ± 4.62 mm, G2.5 (n = 10)는 66.05 ± 15.33 mm, G3 (n = 4)은 93.25 ± 3.97 mm였으며, 일원분산분석을 실시한 결과, 집단 간 유의한 차이를 보였다[F(6, 94) = 324.52, p = 0.000]. Bonferroni 사후 검정 결과 G0-G0.5 (p = 0.08)와 G0.5-G1 (p = 0.422), G1-G1.5 (p = 0.001) 집단 간에는 유의한 차이를 보이지 않았으며, G1.5-G2 (p = 0.000), G2-G2.5 (p = 0.000), G2-G3 (p = 0.000) 간에 모두 유의한 차이를 보였다(Figure 2).
GRBAS 점수 체계에 따른 청지각적 중증도 집단(G) 간 음성 표본에 따른 캡스트럼 측정치 비교
모음의 청지각적 중증도 집단(G)에 따른 캡스트럼 측정치
4점 GRBAS 척도의 grade에 따른 연장 모음 발성에 대한 캡스트럼 분석치의 평균과 표준 편차는 Table 7과 같다.
CPP는 모음 연장 발성에서 G0 (n = 27)집단은 12.53 ± 1.71 dB로 가장 높았고, G1집단(n = 37)은 11.45 ± 1.50 dB, G2 (n = 25)집단은 9.74 ± 2.44 dB, G3 (n = 12)집단은 4.15 ± 2.29 dB로 G3집단이 가장 낮았다(Figure 3). L/H ratio는 G0집단(n = 27)은 33.52 ± 6.50 dB, G1집단(n = 37)은 33.00 ± 4.46 dB, G2 집단(n = 25)은 30.03 ± 4.12 dB, G3집단(n = 12)은 25.22 ± 8.79 dB로 G 점수가 높을수록 감소하였다(Figure 4).
모음의 4점 척도 GRBAS의 청지각적 중증도에 따른 집단 간 캡스트럼 측정치의 차이를 살펴보기 위하여 일원분산분석을 실시한 결과, CPP [F(3, 97) = 58.157, p < 0.001], L/H ratio [F(3, 97) = 7.596, p < 0.001]에서 모두 유의미한 차이를 나타내었다.
한편, 7점 GRBAS척도의 G에 따른 모음의 캡스트럼 측정치는 Table 8에 제시하였다. 모음 연장 발성에서 G0 (n = 13)집단은 13.29 ± 2.02 dB로 가장 높았고, G0.5집단(n = 26)은 11.66 ± 1.20 dB, G1 (n = 17)집단은 11.45 ± 1.87 dB, G1.5 (n = 17)집단은 11.38 ± 1.07 dB, G2 (n = 13)집단은 8.23 ± 2.83 dB, G2.5 (n = 8)집단은 6.82 ± 3.10 dB, G3 (n = 7)집단은 3.98 ± 2.57 dB로 G 점수가 높을수록 CPP값이 감소하였다 (Figure 3). L/H ratio는 G0 (n = 13)집단은 36.66 ± 3.77 dB, G0.5 집단(n = 26)은 34.67 ± 4.82 dB, G1 (n = 17)집단은 31.48 ± 3.36 dB, G1.5 (n = 17)집단은 31.40 ± 3.37 dB, G2 (n = 13)집단은 28.55 ± 5.45 dB, G2.5 (n = 8)집단은 28.17 ± 5.98 dB, G3 (n = 7)집단은 24.72 ± 10.37 dB로 G 점수가 높을수록 L/H ratio값도 낮았다(Figure 4). 모음의 7점 척도 GRBAS의 청지각적 중증도에 따른 집단 간 캡스트럼 측정치의 차이를 살펴 보기 위하여 일원분산분석을 실시한 결과, CPP [F(3, 97) = 58.157, p < 0.001], L/H ratio [F(3, 97) = 7.790, p < 0.001]에서 모두 유의미한 차이를 나타내었다.
연결 발화의 청지각적 중증도 집단(G)에 따른 캡스트럼 측정치
4점 GRBAS척도의 grade에 따른 CPP는 연결 발화에서도 G0 (n = 26)집단은 7.49 ± 1.58 dB로 가장 높았으며, G1집단(n = 40)은 6.33 ± 1.13 dB, G2집단(n = 24)은 5.13 ± 1.43 dB, G3 집단(n = 11)은 2.54 ± 1.77 dB로 가장 낮았다. 한편, L/H ratio는 연결 발화에서도 G0집단(n = 26)은 32.17 ± 4.40 dB, G1집단(n = 40)은 29.88 ± 2.68 dB, G2집단(n = 24)은 27.40 ± 3.86 dB, G3집단(n = 11)은 26.16 ± 6.17 dB로 G0집단이 가장 높고 G3집단이 가장 낮았다(Table 9, Figure 5).
연결 발화의 4점 GRBAS척도의 청지각적 중증도에 따른 집단 간 캡스트럼 측정치의 차이를 살펴보기 위하여 일원분산분석을 실시한 결과, CPP [F(3, 97) = 35.797, p < 0.001], L/H ratio (F(3, 97) = 9.137, p < 0.001)에서 모두 유의미한 차이를 나타내었다.
또한, 7점 GRBAS척도의 grade에 따른 연결 발화의 캡스트럼 측정치는 Table 10에 제시하였다. 연결 발화에서 CPP값은 G0 (n = 29)집단은 7.49 ± 1.65 dB로 가장 높았고, G0.5집단 (n = 18)은 6.68 ± 1.23 dB, G1 (n = 16)집단은 6.40 ± 0.98 dB, G1.5 (n = 12)집단은 5.81 ± 1.54 dB, G2 (n = 12)집단은 4.77± 1.01 dB, G2.5 (n = 10)집단은 3.19 ± 1.56 dB, G3 (n = 4)집단은 2.84 ± 2.23 dB로 G 점수가 높을수록 CPP값이 감소하였다. L/H ratio는 G0 (n = 29)집단은 31.89 ± 4.02 dB, G0.5 집단(n = 18)은 31.37 ± 3.31 dB, G1 (n = 16)집단은 29.21 ± 2.96 dB, G1.5 (n = 12)집단은 28.44 ± 4.19 dB, G2 (n = 12)집단은 26.65 ± 3.82 dB, G2.5 (n = 10)집단은 23.96 ± 3.75 dB, G3 (n = 4)집단은 21.93 ± 4.88 dB로 G 점수가 높을수록 L/H ratio값도 낮았다.
연결 발화의 7점 GRBAS척도의 청지각적 중증도에 따른 집단 간 캡스트럼 측정치의 차이를 살펴보기 위하여 일원분산분석을 실시한 결과, CPP [F(6, 94) = 17.257, p < 0.001], L/H ratio [(F(6, 94) = 10.264, p < 0.001]에서 모두 유의미한 차이를 나타내었다.
캡스트럼 측정치의 GRBAS척도 점수 체계에 따른 청지각적 중증도(G) 집단 간 변별력
GRBAS척도별 청지각적 중증도에 따른 각 집단의 음향학적 측정치의 차이를 살펴보고 어떠한 GRBAS 점수 척도가 G 집단의 중증도를 잘 변별하는지 살펴보고자 Bonferroni 사후 분석을 실시하였다.
4점 GRBAS척도의 경우, 캡스트럼 측정치인 CPP는 /ㅏ/모음 연장 발성에서 G1-G2 (p < 0.01), G2-G3 (p < 0.001)집단 간 차이만 나타내었으나(Figure 3), 연결 발화에서는 G0-G1 (p < 0.001), G1-G2 (p < 0.01), G2-G3 (p < 0.001)집단 간 차이가 있었다. L/H ratio는 /ㅏ/ 모음 연장 발성과 연결 발화에서 집단 간 모두 차이가 없었다(Figure 4).
한편, 7점 GRBAS척도에서는 CPP는 /ㅏ/ 모음 연장 발성에서 G1.5-G2(p < 0.01)집단 간만 차이를 보였고, 연결 발화에서 CPP와 L/H ratio는 G0-G0.5, G0.5-G1, G1-G1.5, G1.5-G2, G2-G2.5, G2.5-G3집단 간 모두 차이가 없었다(p > 0.05) (Figure 4 , 5).
DISCUSSIONS
본 연구는 GRBAS척도의 파라미터 중 가장 재현성이 뛰어나다고 알려져 있는 G 점수(De Bodt et al., 1997; Karnell et al., 2007)와 CAPE-V 중 재현성이 뛰어나다고 알려진 전반적 중증도(OS)를 사용하여(Zraick et al., 2011) 청지각적 평가 척도 간 청지각적 중증도를 비교하여 임상적 유용성을 살펴보았다. 실제 임상에서는 4점으로 평정되는 GRBAS척도의 점수 체계로는 평정하기 애매한 경우 0, 1, 2, 3점 사이를 추가로 더 세분화하여 0.5 체계를 흔히 사용하기도 한다. 본 연구에서는 장애 음성을 대상으로 0, 0.5, 1, 1.5, 2, 2.5, 3의 총 7점 체계를 사용하여 모음과 연결 발화에서 청지각적 중증도를 평가하여 전통적인 GRBAS척도의 4점 척도 및 CAPE-V와 신뢰도를 비교하였다. 더 나아가 동일한 음성 샘플에 대해 서열 척도인 두 가지 GRBAS척도와 시각적 아날로그 척도인 CAPE-V 간의 점수 분포를 각각 비교하였으며, 본 연구에서 사용된 청지각적 평가 중 어떠한 평가 척도가 음성장애의 중증도를 변별하는 데 임상에서 유용하게 사용될 수 있을지 살펴보았다.
검사자 내 및 감사자 간 신뢰도
본 연구에서 사용한 세 가지 서로 다른 청지각적 평정 척도의 중증도에 대한 검사자 내 신뢰도는 0.828~0.947로 높은 평가자 내 신뢰도를 나타내었으며, 검사자 간 신뢰도도 0.681~0.921로 세 개의 청지각적 평정 점수 체계에서 비교적 높은 수준의 신뢰도를 나타내었다. 특히, 검사자 내 및 검사자 간 신뢰도는 연속 척도인 CAPE-V의 청지각적 중증도(OS)가 GRBAS척도의 G에 비해 더 높게 나타났다. 이는 CAPE-V가 100 mm 연속선상의 시각적 아날로그 척도가 연속 척도로서 모수 통계를 사용하므로 좀 더 강한 통계적 검정력을 지닐 뿐만 아니라 CAPE-V는 100 mm 선상에 경도, 중도, 심도와 같은 표준적 anchor를 제시해 주기 때문에 검사자 내 및 검사자 간 평정의 오차를 줄이는 데 도움을 주는 것으로 여겨진다. Karnell et al.(2007)의 연구에서는 34명의 음성장애 환자의 청지각적 평가를 위해 4명의 평정자가 검사자 간 신뢰도를 측정하였으며, GRBAS척도는 대화 수준에서 평정하였고, CAPE-V는 CAPE-V 자극어를 모두 듣고 평정하였다. 이때, GRBAS척도의 G 점수의 검사자 간 신뢰도는 0.80~0.89로 다소 낮은 편이었으며, CAPE-V의 OS 척도는 0.86~0.93으로 나타나 CAPE-V가 평가자 간 신뢰도가 더 높은 것으로 보고하였다. 또한, 검사자 내 신뢰도도 CAPE-V는 0.89~0.92였고, GRBAS척도는 0.83~0.90으로 CAPE-V가 좀 더 높게 나타났다. 이러한 이유는 GRBAS척도는 4점 서열 척도로서 전체 범위의 25%의 차이를 나타내 준다면, CAPE-V는 신뢰도에 훨씬 적은 영향을 주기 때문이라고 하였다.
이와 마찬가지로, Nemr et al.(2012)의 연구에서는 5년 이상의 음성장애 평가 경험이 있는 3명의 임상가가 GRBAS척도와 CAPE-V를 사용하여 60명의 음성장애 환자를 대상으로 청지각적 평정을 실시하였다. 그 결과, 검사자 내 신뢰도는 0.923~0.985이었고, 검사자 간 신뢰도는 4점 GRBAS척도의 G는 0.881, CAPE-V의 OS는 0.911로 GRBAS척도에 비해 CAPE-V의 검사자 간 신뢰도가 높은 것으로 나타나 본 연구의 결과와 마찬가지로 CAPE-V의 신뢰도가 더 높은 것으로 나타났다. Zraick et al.(2011)의 연구에서는 11명을 대상으로 21명의 언어재활사가 청지각적 평정을 실시하여 평가자 내 신뢰도를 비교하였는데, CAPE-V의 전반적 중증도는 0.57로 낮은 편이었고, GRBAS척도에서는 0.65로 나타났다. 반면 검사자 간 신뢰도는 CAPE-V의 OS는 급내상관계수가 0.76으로 다른 척도에 비해 가장 높았으며, GRBAS척도에서 G 점수의 급내상관계수는 0.66이었다. 선행 연구들에 의하면, GRBAS척도는 임상가들에게 척도가 비교적 간단하여 신뢰롭고 편리하게 사용되어 왔으나, GRBAS척도는 CAPE-V에 비해 음성 변화를 감지하는 데 덜 민감한 것으로 보고하였다. 이는 GRBAS척도가 순서 척도로서 청지각적 평정 시 정상, 경도, 중도, 심도의 4가지 중에서만 선택을 해야 하는 반면, CAPE-V는 음질의 변화를 더 세심하게 평가할 수 있기 때문이다.
위의 결과와는 대조적으로 Wuyts et al.(1999)은 29명의 평정자들이 14명의 음성장애 환자를 대상으로 10 cm의 CAPE-V의 시각적 아날로그 척도와 6점 순서 척도(0, 1, 2, 3, 4, 5)로 변형하여 4점 GRBAS척도와 비교하였다. 이때 CAPE-V는 등간격(equal-appearing interval, EAI)척도로 청지각적 중증도를 평정하였다. 청지각적 중증도를 평가한 결과, 4점 GRBAS척도가 CAPE-V의 시각적 아날로그 척도에 비해 더 높은 검사자 간 신뢰도를 나타내었다. 이러한 결과는 첫째, 검사자가 29명으로 평정자 수가 많아 검사자 간 일치도가 감소했을 가능성이 있다. 둘째, CAPE-V는 본 연구와는 달리 평정 시 100 mm 선상에 왼쪽의 끝부분은 정상, 오른쪽의 끝부분은 매우 심함만을 표시해 주는 시각적 아날로드 척도를 사용하였다. 따라서, 0, 1, 2, 3과 같이 4개 중 하나만 선택하는 4점 척도에 비해 선택할 수 있는 지점의 범위가 매우 넓고 다양해지므로 검사자 내 및 검사자 간 평정 시 더 많은 변이가 발생한 것으로 여겨진다. 한편, 이전에 모든 연구들은 4점 GRBAS 서열 척도와 CAPE-V의 시각적 아날로그 척도의 청지각적 평정만을 비교하였으나, 본 연구에서는 4점 GRBAS척도와 0.5점 체계로 더 세분화한 7점 GRBAS 척도와 비교하였는데, 7점 GRBAS척도의 청지각적 중증도(G)에 대한 검사자 간 신뢰도는 4점 GRBAS척도보다 낮게 나타났다. 이는 7점 GRBAS척도가 4점 GRBAS척도에 비해 좀 더 세심하게 음질의 중증도를 분석할 수 있으나, 선택의 평정 점수가 7점으로 좀 더 복잡해졌기 때문에 개인 간 변이가 더 심하게 나타난 것으로 추측할 수 있겠다.
4점 GRBAS척도, 7점 GRBAS척도, CAPE-V에 따른 청지각적 평정
일반적으로 GRBAS척도와 CAPE-V는 음성장애의 원인에 상관없이 모든 종류의 음성장애를 평가하며, GRBAS척도는 일정한 간격으로 음성장애의 중증도를 평정하는 반면, 본 연구에서 사용한 CAPE-V는 시각적 아날로그 척도이지만 100 mm 선상에 비대칭적인 분포로 경도(mild), 중도(moderate), 심도(severe)의 중증도를 나타내준다(Kempster et al., 2009) (Appendix).
4점 GRBAS척도와 7점 GRBAS척도를 사용하여 모음과 연결 발화에 대한 청지각적 평정 결과, 음성 샘플(모음 vs. 연결 발화)에 따라 청지각적 중증도가 다르게 나타났다. 이는 청지각적 평정 시 모음 연장 발성만으로는 음질의 중증도를 파악하기 어려우며, 모음과 연결 발화를 모두 사용하여 음질을 평가하는 중요함을 시사한다. 또한, 7점 GRBAS척도에서는 4점 척도에 비해 정상이나 심도와 같이 극단점을 평가하는 경향이 감소하였다. 이는 7점 GRBAS척도가 음질을 더 세분화하여 검사한 결과로 해석할 수 있을 것이다.
모음과 연결 발화의 CAPE-V의 OS는 두 가지 GRBAS척도의 청지각적 중증도(G)에 따라 모두 유의한 차이를 보였다. 이러한 결과는 OS가 연속 척도이며, G가 순서 척도이지만 G가 증가함에 따라 OS 점수도 같이 증가하는 것을 의미한다. 그러나, 4점 GRBAS척도는 모음과 연결 발화에서 청지각적 중증도(G) 집단 간에 모두 OS 점수 분포가 유의한 차이를 보인 반면, 7점 GRBAS척도는 모음의 경우는 G0-G1집단 간에, 연결 발화는 G0-G1.5집단 간에는 차이를 보이지 않았다. 이는 Appendix에 보이는 바와 같이, CAPE-V의 청지각적 중증도(OS)에서는 정상과 경도(MI) 지점이 가까이 분포하며, 중도(MO)-심도(SE)지점이 비교적 멀리 떨어져 있는 비대칭적인 중증도 분포를 나타내고 있기 때문에 7점 GRBAS척도로 좀 더 세분화하여 청지각적 평정을 할 경우, 정상과 경도의 청지각적 중증도(G) 집단 간 CAPE-V의 OS 점수에 차이가 나타나지 않은 것으로 여겨진다.
GRBAS 점수 체계에 따른 청지각적 중증도 집단(G) 간 음성 표본에 따른 캡스트럼 측정치
장애 음성은 대부분 비주기적이므로 심각한 음질일수록 변동률 분석에 부적합하고(Choi et al., 2012; Choi & Choi, 2014), CSL의 multi-dimensional voice program (MDVP)를 사용한 변동률 분석은 음질이 좋지 않을수록 분석 실패가 발생할 수 있으며, 연결 발화를 분석하는 데 어려움이 있다(Yu et al., 2017). 또한, 모음과 연결 발화의 캡스트럼 측정치인 캡스트럼 현저성(CPP)이 청지각적 평정과 가장 상관이 높은 것으로 알려져 있으며(Awan et al., 2014), 장애 음성 중증도 변별에 가장 유용한 음향 지표라고 하였다(Yu et al., 2017). Pyo et al.(1999)의 연구에서는 성대폴립 환자 30명을 대상으로 모음 연장 발성을 통해 GRBAS척도와 MDVP 측정치 간 상관성을 살펴보았다. 그 결과, G척도와 MDVP 측정치 간에 가장 상관성이 높게 나타났으며, 특히, G와 R척도는 음도 변이 및 강도 변이 관련 변인들과 모두 높은 상관성을 보였으나, 음도 변이보다는 강도 변이 관련 변인들과 상관성이 더 높게 나타났다. 본 연구에서는 다양한 기능적, 기질적, 및 신경학적 음성장애 환자를 포함하였는데 G3으로 평정된 음성장애의 경우, MDVP를 사용한 변동률 분석이 어려운 경우가 있었다. 또한, 본 연구에서는 모음뿐 아니라 연결 발화 분석이 가능한 캡스트럼 및 스펙트럼 측정치를 구하여 4점 GRBAS척도와 0.5점 체계가 허용된 7점 GRBAS척도와의 상관성을 살펴보았다. 그 결과, 4점 GRBAS척도와 7점 GRBAS척도 모두 청지각적 중증도(G)가 높아질수록 모음과 연결 발화의 CPP와 L/H ratio는 감소하는 경향이 있는 것으로 나타났다. 특히, 어떠한 GRBAS 점수 척도가 G 집단의 중증도를 잘 변별하는지 살펴보기 위하여 G집단 간 음질과 상관성이 가장 높다고 알려진 CPP측정치를 비교하였다. 그 결과, 4점 GRBAS척도에서는 CPP가 /ㅏ/ 모음 연장 발성에서 G1-G2, G2-G3집단 간 차이만 나타내었으나, 연결 발화에서는 G0-G1, G1-G2, G2-G3집단 간 모두 차이를 보여 비교적 청지각적 중증도를 잘 변별해 주었다.
한편, 7점 GRBAS척도에서 CPP는 /ㅏ/ 모음 연장 발성에서는 G1.5-G2집단 간만 차이를 보였고, 연결 발화에서 CPP는 G0-G0.5, G0.5-G1, G1-G1.5, G1.5-G2, G2-G2.5, G2.5-G3집단 간 모두 차이를 보이지 않았다. 따라서, 이와 같은 결과로 비추어 볼 때 7점 GRBAS척도는 청지각적 중증도를 좀 더 세밀히 분석할 수 있으나, GRBAS 4점 척도에 비해 음성장애 중증도를 잘 변별해 주지 못하는 것으로 여겨진다.
하지만, 청지각적 평정 측정치와 캡스트럼 측정치 간 상관관계를 살펴본 결과, CPP 측정치는 4점 GRBAS척도의 G 점수와 7점 GRBAS척도의 G 점수 및 CAPE-V의 OS와 모두 유의한 부적 상관관계를 보였다. 이러한 결과는 이전의 선행 연구와 마찬가지로 GRBAS척도는 모음과 연결 발화에서 모두 CPP와 L/H ratio 측정치와 부적 상관관계가 있다는 결과와 유사한 결과를 나타내었다(Choi & Choi, 2016; Lee & Kim, 2020; Yu et al., 2017). CPP와 가장 높은 상관성을 보인 것은 모음과 연결 발화의 CAPE-V의 OS였으며, L/H ratio는 모든 청지각적 평정 체계의 중증도와 낮은 상관성을 보였다. 본 연구에서 CPP와 청지각적 평정 척도 간 상관성을 살펴본 결과, 모음의 CPP와 가장 높은 상관을 보인 것은 CAPE-V의 OS였으며(r = -0.743), 7점 GRBAS 척도의 G (r = -0.725), 4점 GRBAS척도의 G (r = -0.709) 순이었다. 이와 마찬가지로, 연결 발화의 CPP와 가장 높은 상관을 보인 것은 CAPE-V의 OS였으며(r = -0.707), 7점 체계 GRBAS척도의 G (r = -0.653), 4점 체계 GRBAS척도의 G (r = 0.650)였다. 따라서, 수정된 7점 체계 GRBAS척도가 CAPE-V보다는 음향학적 상관이 낮았지만, 기존의 4점 체계 GRBAS척도보다 상관성이 약간 높게 나타났다. 이는 7점 GRBAS척도가 좀 더 세분하여 청지각적 중증도(G)를 분석하기 때문에 CPP와 상관성이 더 높게 나타난 것으로 여겨진다. Lowell et al.(2012)의 연구에서는 캡스트럼 분석의 측정치는 GRBAS와 CAPE-V의 청지각적 평정과 높은 상관성을 보였고, 정상 음성과 장애 음성을 감별하는 데 가장 민감한 음향학적 지표라고 하였으며, Choi & Choi(2014)의 연구에서도 모음의 CPP를 측정한 결과, GRBAS척도의 G, R, S와 가장 높은 상관을 보였다. Yu et al.(2017)의 연구에서도 장애 음성의 청지각적 중증도가 증가할수록 주파수 변동률(jitter, %), 진폭변동률(shimmer, %), 소음대 배음비(NHR)가 증가하는 경향을 보였으며, L/H ratio, CPP 간에 부적 상관을 보고하였다.
이상의 결과를 종합해 볼 때, 수정된 7점 GRBAS척도는 기존의 GRBAS척도에 비해 청지각적 중증도를 보다 세밀하고 자세히 분석할 수 있으며 객관적인 청지각적 중증도를 나타내는 음향학적 측정치와 높은 상관성을 나타내었으나, 기존의 4점 GRBAS척도에 비해 청지각적 중증도의 변별력은 감소하는 것으로 나타났다. 따라서, 이러한 점을 고려하여 수정된 7점 GRBAS척도는 기존의 GRBAS척도 및 CAPE-V와 더불어 임상에서 청지각적 평가 도구로서 유용하게 사용될 수 있을 것이다. 본 연구는 GRBAS척도를 좀 더 세분화하여 임상에서 사용하고 있는 0.5점 체계인 7점 GRBAS척도를 표준화된 4점 GRBAS척도와 CAPE-V와 비교하여 임상적 유용성을 살펴본 것에 의의가 있다. 본 연구의 결과를 통해 제한점과 후속 연구에 대한 제언은 다음과 같다. 첫째, 본 연구에서는 GRBAS척도 중 가장 재현성이 높은 G 점수와 CAPE-V의 전반적 중증도만을 비교한 제한점이 있다. 추후의 연구에서는 G 점수뿐 아니라 다른 척도인 B, R, A, S척도에 대한 청지각적 평가로 확대하여 7점 GRBAS척도의 임상적 유용성을 조사할 필요가 있다. 둘째, 본 연구에서는 청지각적 평정과 가장 상관성이 높다고 알려진 캡스트럼 측정치와 상관성을 비교하였다. 추후의 연구에서는 7점 GRBAS척도 및 CAPE-V와 환자 중심의 주관적 평가 도구 및 모음과 연결 발화의 공기역학적 측정치와의 상관성을 살펴볼 필요가 있다.
Acknowledgements
This work is supported by 2020 research grant of Daegu Catholic University.
Notes
Ethical Statement
N/A
Declaration of Conflicting Interests
There are no conflict of interests.
Funding
N/A
Author Contributions
Conceptualization: Seong Hee Choi. Data curation: Miok Yu. Formal analysis: Seong Hee Choi, Miok Yu. Writing—original draft: Seong Hee Choi. Writing—review & editing: Chul-Hee Choi. Approval of final manuscript: all authors.