이항분포·정규분포에서 ANOVA, QBD까지
확률과 통계 세특 의약품 품질관리 심화 탐구
메디컬저널
메디컬 현업 전문가팀
확률과 통계 세특에 활용할 수 있는 의약품 품질관리 심화 탐구 보고서입니다. 이항분포와 정규분포의 관계, 6시그마 개념, ANOVA 분산분석을 통한 배치 간 균질성 검증, QBD 실험설계(완전·부분 요인설계)까지 의약학 진로연계로 정리합니다.
안녕하세요! 고품격 메디컬계열 심화탐구 전문채널 메디컬저널입니다
이번 주제는 고등수학 확률과 통계 과목의 이항분포, 정규분포의 개념에서 시작하여 다수의 집단을 통계적으로 비교할 때 아주 실용적으로 활용되는 분산분석(ANOVA)의 방식과, 또한 이를 기반으로 하여 의약품 품질관리의 목적으로 최근 의약 산업계에서 아주 뜨거운 주제인 QBD(Quality By Design)에 대해 다루어보려 합니다.
특히 QBD는 최근 의약품이 허가/승인 받기 위해 식약처에 제출해야하는 거의 필수적인 자료로서, 제약바이오 분야의 선진국을 목표로하는 국내 제약업계에서 그 중요성이 심화되고 있는 만큼, 해당 주제에 대한 지식을 갖추며 생기부를 작성하는 것은 의약보건계열 진학에 큰 경쟁력이 될 것으로 기대할 수 있습니다.
Six Sigma(σ) : 품질 관리 방법론

✔️ 전자제품 기업인 '모토로라'사에서 시작되어 1900년대~2000년대에 큰 인기를 끌었던 품질 관리 경영 기법 6 시그마(6σ)에 대해 들어보신 적이 있으신가요? 아마 시그마(σ)는 수학 '확률과 통계' 교과목에서 (모)표준편차로서 배운 적이 있으실 겁니다. 그렇다면 6시그마가 의미하는 것은 무엇일까요?
❗️ 어떤 회사의 공장에서 특정 제품을 생산할 때, 만들어진 여러개의 제품들은 특정 요소에 대해 재현성 있는 일관된 값을 가질 필요가 있습니다. 예를 들어, '타이레놀' 한알은 아세트아미노펜 성분 500mg을 일관되게 함유하고 있어야합니다.
하지만 모든 타이레놀 정제 한알이 정확히 500mg 의 아세트아미노펜을 함유하도록 제조하는 것은 현실적으로 어려운 일일 수 있습니다. 실제 타이레놀에 함유된 아세트아미노펜의 함량은 정규분포의 형태를 취하고 있을 것입니다.
이때 우리의 목표는 타이레놀의 아세트아미노펜 함유량 분포가 목표 함량인 500mg을 평균(μ)으로 하여 아주 좁은 분포를 나타내도록 하는 것입니다. 좁은 분포란, 우리가 확률과 통계 과목에서 배운 것으로 표현하자면 작은 분산 혹은 작은 표준편차를 의미합니다.
❗️ 이러한 목적을 위해 우선 회사에서는 허용할 수 있는 제품 규격을 설정합니다. 예를들면 500mg이 목표치라면, ± 6mg을 허용 규격으로 하여 494mg~506mg까지의 제품을 양품으로, 범위를 벗어나는 제품을 불량으로 취급하도록 결정할 수 있습니다.
그 이후 제품 생산 공정 요소들을 정밀하게 관리하여 정규분포가 좁은 분포로서 494mg~506mg 에 들어올 수 있도록 해야합니다. 이때 이러한 규격과 분포 사이의 관계를 설명하기 위해 n시그마의 개념이 활용됩니다. 6시그마란, 평균값을 기준으로 양쪽으로 3시그마, 즉 전체 6시그마가 설정 규격 내로 들어오도록 하는 것을 의미합니다.
이때 정규분포에서 평균을 기준으로 6시그마에 해당하는 영역(μ ± 3σ)은 전체 정규분포 중 99.73%를 차지하는 것으로, 즉 제품을 생산하였을 때, 초기 설정한 제품 규격내로 6시그마가 위치한다면 이는 99.73%의 제품이 양품이며, 불량률은 단 0.27%에 지나지 않음을 의미합니다.
예를들면, 아세트아미노펜 함량 규격을 494mg~506mg 설졍하였을 때 제품 생산 이후 수많은 제품들에 포함된 아세트아미노펜 함량 분포의 3σ=6mg, 즉 표준편차(σ)가 2mg인 좁은 분포를 나타내도록 엄격하게 제품 생산 공정을 관리해야함을 의미합니다.
* 정규분포의 표준화로도 설명할 수 있습니다.
더욱 엄격해야 하는, 의약품 품질 관리

✔️ 의약품은 인체에 적용되며, 질병을 치료, 예방하는 목적을 정확히 수행하기 위해서는 엄격한 품질관리가 필요합니다. 품질관리의 실패(불량)가 단순히 불편함이나 불만을 만들어내는 다른 제품들과 달리, 의약품의 불량은 예방, 치료의 실패 뿐만 아니라 생명과 직결될 수 있는 각종 부작용들을 야기할 수 있습니다.
❗️ 그러한 이유로 의약품은 반드시 GMP(Good manufacturing practice) 품질 기준 인정을 받아야하며(최근에는 건강기능식품 역시 GMP 기준이 의무화 되었습니다.) 의약품 허가를 위해서 GMP 조직도와 품질관리 관련 자료들을 제출해야 합니다. 그러한 의약품 품질관리 과정에서는 앞서 설명한 6 시그마와 같은 낮은 불량률을 위한 구체적인 방법론적 도구가 필요하며, 그것 중 하나가 바로 오늘 다루어 볼 QBD라 할 수 있습니다.
확률과 통계 과목을 배우며 특히나 통계 관련 내용들에 큰 흥미를 느꼈고, 그 중에서도 표본이 많을 때에는 통계적으로 정규분포에 근사한다는 점에서 해당 개념이 특히 나의 진로 분야인 의약학 계열을 비롯한 산업 현장의 통계적 분석에서 유용하게 활용될 개념이라는 생각이 들었다. 특히 교과내용에서는 소개되지 않지만, 정규분포에 심화되는 내용으로서 여러 집단을 비교하기 위해 활용되는 ANOVA 분산분석에 대해 탐구해보고 싶은 생각이 들었고 다른 제품들보다 엄격한 품질관리가 필요한 의약품 생산에 이러한 개념이 어떻게 적용되고 있는지를 조사해보고 싶은 생각이 들었다. 뿐만아니라 최근 제약 산업 공정에서 뜨거운 이슈가 되는 QBD 개념이 무엇이며, 이것이 통계적으로 어떤 의미가 있고 실제 의약품 품질관리에 어떤식으로 적용되는지를 자세히 탐구해보려 한다.
의약품 품질 특성의 이항분포와 정규분포

✔️ 정규분포에 대해 설명하기 이전에, 교과서에서 소개되는 이항분포에 대해 먼저 살펴보겠습니다. 이항분포란 교과서에서 '한번의 시행에서 사건 A가 일어날 확률이 p로 일정할 때, n번의 독립시행에서 사건 A가 일어날 횟수를 확률변수 X라 하면, 이때 X의 확률분포를 이항분포라 한다'라 설명되어 있습니다.
우선 이때 말하는 사건이란 yes와 no 두가지의 선택지만이 있는 독립적 '베르누이 시행'이어야 합니다. 흔히 동전 앞 뒷면이 나오는 횟수의 확률분포로서 설명되는데, 동전을 100번 던졌을 때(n=100), 각각의 독립시행에서 앞면이 나올 확률은 1/2이므로(p=1/2), 앞면이 나오는 횟수의 기댓값(평균)은 50번이 될 것입니다.
이러한 이항분포를 B(n,p)로 표현하며 평균 E(X)=np, 분산 V(X)=npq=np(1-p)이 됩니다. 그런데 만약 동전을 10번 던졌다면, 앞면이 나오는 횟수가 5번이 아닐 수 있지만, 10000번 던진다면, 기댓값(평균,np)인 5000에 거의 근접하게 될 것입니다. 이러한 현상을 큰수의 법칙이라 합니다.
남들과 다른 세특, 어떻게 시작할지 막막하다면?
세특 탐구 특화 아카AI로 나만의 주제 추천받으세요.
