boxplot 예제

상자 플롯을 사용하면 하나 이상의 데이터 세트를 빠르게 그래픽으로 검사할 수 있습니다. 상자 플롯은 히스토그램 또는 커널 밀도 추정치보다 더 원시적으로 보일 수 있지만 몇 가지 장점이 있습니다. 공간을 적게 차지하므로 여러 그룹 또는 데이터 집합 간의 분포를 비교하는 데 특히 유용합니다(예: 그림 1 참조). Bins 기술의 수와 너비를 선택하면 히스토그램모양에 큰 영향을 미칠 수 있으며 대역폭 선택은 커널 밀도 추정값의 모양에 큰 영향을 미칠 수 있습니다. 일반적으로 분산된 대규모 데이터 집합에서 이상값으로 의심되는 경우는 드물지 않습니다(예: 100개 이상의 데이터 포인트). 이상값은 약 10,000개 이상의 데이터 요소가 있는 일반적으로 분산된 데이터 집합에서 예상됩니다. 다음은 상자 플롯으로 표시되는 1000개의 일반적으로 분산된 데이터의 예입니다: “동일하고 동일하지 않음”은 대부분의 데이터 집합에 대한 짧고 정확한 설명입니다… 예를 들어 단풍 나무 잎 더미. 단풍 나무잎은 크기가 거의 같지만 약간의 차이가 있습니다. 설명 통계는 숫자를 사용하여 데이터가 동일하고 동일하지 않은 방법을 설명하려는 시도입니다. 상자 플롯(상자 및 수염 다이어그램이라고도 함)은 최소, 첫 번째 사분위수, 중앙값, 세 번째 사분위수 및 최대값의 다섯 숫자 요약을 기반으로 데이터의 분포를 표시하는 표준화된 방법입니다.

가장 간단한 상자 플롯에서 중앙 사각형은 첫 번째 사분위수에서 세 번째 사분위수(사분위수 범위 또는 IQR)에 걸쳐 있습니다. 사각형 내부의 세그먼트는 중앙값과 상자 아래의 “수염”을 표시하여 최소 및 최대 위치를 표시합니다. 예를 들어 데이터 집합 공기 품질에서 온도는 숫자 벡터가 될 수 있습니다. 월은 그룹화 변수가 될 수 있으므로 매월 각각의 boxplot을 별도로 얻을 수 있습니다. 데이터 집합에서 월은 숫자(1=1월, 2월 등)의 형태입니다. 특이한 백분위수는 2%, 9%, 91%, 98%는 때때로 수염 교차 해치에 사용되며 수염 끝은 7개의 숫자 요약을 표시합니다. 데이터가 일반적으로 분산되는 경우 상자 플롯의 7개 마크 의 위치는 균등하게 간격을 지정합니다. A1={0.22, -0.87, -2.39, -1.79, 0.37, -1.54, 1.28, -0.31, -0.74, 1.72, 0.38, -0.17, -0.62, -1.10, 0.30, 0.15, 2.30, 0.19, -0.50, -0.09} 이상치를 정의하는 것, “최소”는 아직 명확하지 않다. 다음 섹션에서는 이를 지우려고 합니다.

boxplot() 함수는 다음과 같이 표시된 6개의 구성 요소가 있는 목록을 반환합니다. 아래 코드는 데이터를 팬더 데이터 프레임으로 읽습니다. DataFrame에서 .boxplot()를 호출하여 박스플롯을 플롯할 수 있습니다. 아래 코드는 다른 진단과 관련하여 area_mean 열의 박스플롯을 만듭니다. B2= {2.37, 2.16, 14.82, 1.73, 41.04, 0.23, 1.32, 2.91, 39.41, 0.11, 27.44, 4.51, 0.51, 0.51, 4.50, 0.18, 14.68, 4.66, 1.30, 2.06, 1.19} 데이터 세트가 거의 동일한 값 범위(약 .1에서 약 50)에 걸쳐 있음을 알 수 있습니다. 대부분의 B1 값은 1개 미만인 반면 대부분의 B2 값은 둘 이상입니다. 로그 배율을 사용하여 이 넓은 범위의 값을 더 잘 표시할 수 있습니다. 데이터의 가변성 또는 분산성에 대한 정보가 있어야 합니다. boxplot은 데이터의 값이 분산되는 방식을 잘 나타내는 그래프입니다. 상자 로트는 히스토그램 또는 밀도 플롯과 비교하여 원시적으로 보일 수 있지만 공간을 적게 차지하는 장점이 있으므로 많은 그룹이나 데이터 집합 간의 분포를 비교할 때 유용합니다. 조정된 상자 플롯은 스큐 분포를 위한 것입니다.

그들은 왜곡의 medcouple 통계에 의존. [6] MC의 medcouple 값의 경우, 상부 및 하부 수염의 길이는 각각 대칭 분포의 경우 메드커플이 0이 되고 1.5 I Q R {디스플레이 스타일과 동일한 수염 길이로 Tukey의 박스플롯으로 줄어듭니다. 두 수염에 대해 1.5IQR}.

Shares

Posted on 2nd August 2019 in Uncategorised

Share the Story

About the Author

Back to Top
Shares