[CRUX]수치 데이터를 이용한 표본분석 : 이론
크럭스(CRUX) 컨설팅
크럭스 컨설팅 12월 11일(월) 올해 마지막 정시예약 : 여기 클릭하시면 됩니다.
<수치 데이터를 이용한 표본분석 이론>
안녕하세요. CRUX 김희범입니다.
(글 읽으시기 전에 ‘좋아요’와 ‘팔로우’ 부탁드립니다)
표본분석이란 무엇일까요? 표본분석은 왜 하는 것일까요?
이 질문에 대한 답변은 표본분석을 시도하는 이유와 이용하는 방법에 따라 크게 달라질 수 있습니다.
전통적인 표본분석은 내 위에 있는 모든 사람들을 조사하고 기록하고 관찰하는 것입니다. 지원권이 한정된 폐쇄된 구간에서 흔히 ‘카운팅’이라고 불리는 방법으로 허수, 추합 등 빠져나갈 인원을 한 명씩 걸러냅니다. 경쟁자들의 점수, 타 지원 학과를 하나씩 찾고 별명을 붙이거나 특이사항을 메모할 수도 있습니다. 이러한 추적은 잘못하면 끝이 없는데, 경쟁자들이 지원한 학과의 표본을 열어보지 않으면, 결국 의미가 없기 때문입니다. 따라서 매우 제한적으로만 사용할 수도 있고, 개인이 사용할 수 있는 대상 범위는 넓게 잡아도 이과는 인설의, 문과는 과거 서울대 지원권 정도입니다. 이러한 방법의 목적은 닫힌 구간 내 미시적인 한두 자리 싸움에서 승리하는 것입니다.
그보다 넓은 구간에서도 내 위 경쟁자들의 점수를 하나씩 기록할 수는 있습니다. 하지만 추합을 따지거나 경쟁자의 이동을 찾자니 끝이 없습니다. 요즘 계열제 모집단위나 대형과는 모집인원만도 100명이 넘어가는데, 이들을 모두 기록하고 있을 수는 없는 노릇입니다. 오히려 간소하게 각 ‘표본’이 아니라 ‘수치’를 다루기도 합니다. 나의 등수가 몇 등인지, 예상 컷부터 나까지 몇 명이나 있는지 등입니다. 그런데 이런 데이터는 모아 놓아도 제대로 읽기가 어렵습니다. 각 수치들이 어떤 의미를 내포하고 어떻게 연결되는지 잘 모르기 때문입니다. 그리고 분석서비스들이 제공하는 수치 지표들은 결국 분석서비스가 제공하는 결론으로 귀결됩니다. 그렇다 보면 숫자들에서 유의미한 정보를 뽑아내지 못하고 ‘칸수’에 매몰됩니다.
수치를 다루는 표본분석의 목적은 무엇일까요? 수치를 이용한 표본분석의 목적은 거시적인 측면에서 ‘흐름’을 읽는 것입니다. 한두자리 싸움에 집중하는 것이 아니라, 내가 속한 게임판의 상황을 읽는 용도입니다.
입시에 임하는 개인이 ‘흐름’을 읽는 것은 매우 어렵고 한정적입니다. 아래는 ‘개인’이 조금이나마 흐름을 느낄 수 있도록 하는 의도에서, 최대로 간략화한 데이터 정리 시트 양식입니다. (저희 '컨설턴트'들은 훨씬 더 종합적인 다른 방식을 사용합니다. 기본적으로 제 노하우를 바탕으로 하되, '개인'도 시도해볼 수 있도록 계량했습니다.)
오늘은 바로 이 수치 데이터를 이용한 표본분석에 대해서 소개해 보려 합니다.
엄밀히 말하면 표본분석이라기보다는 나만의 입시 리포트, 혹은 입시 포트폴리오라고 생각할 수 있을 것 같습니다. 필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 수치를 모으고 계산하면 됩니다. 오늘은 양식에 대한 설명이고, 다음 글이 보다 실전적일 예정입니다.
먼저 상단은 과거 데이터와 올해 나의 정보를 기입하는 부분입니다.
왼쪽 위에는 관찰하고자 하는 학과 정보(학교, 군, 학과)를 적습니다.
상단 중앙 부분에는 과거 데이터를 입력합니다. 당시의 모집정원과 추가합격인원, 지원자수를 기입하면, 엑셀을 이용하여 자동으로 합격총원, 추합율, 최종경쟁률을 구할 수 있습니다.
이렇게 정보를 기입해 놓으면, 어느 정도 규모의 과인지, 어느 정도 추합이 도는지, 경쟁률은 어느 정도 되는지를 확인할 수 있습니다. 다만 주의할 점은 학과 신설, 통폐합, 군 변동, 입시 정책 변화(교차지원 도입) 등에 따라 데이터가 크게 바뀔 수 있습니다. 올해가 바로 그 변화의 해일 수도 있고요. 이러한 히스토리와 특이사항을 가장 오른쪽 메모란에 기록해 놓으면 됩니다.
과거 누백도 기록합니다. 컨설턴트들은 조금 더 체계적인 방법을 사용하지만, 개인이시라면 많이들 이용하는 누백 데이터를 쓰셔도 무방합니다. 70% 누백은 공시되는 정보를 바탕으로 하는데, 과거 합격인원의 허리하단부 누백을 확인할 수 있게 해주어 안정 지원 범위를 확인시켜줍니다. 100% 누백은 점공 등을 통해 확인하거나 자체적으로 예측한 추정치에 바탕으로 둡니다. 인터넷에 돌아다니는 누백은 틀린 정보가 많지만, 일반적으로 폭빵을 확인할 수는 있습니다. 3~4개년치 데이터에서 툭 튀는 누백값이 보이면 폭이나 빵으로 보시면 됩니다. 이러한 내용도 해석해서 오른쪽 메모란에 적어놓으면 좋습니다.
그리고 과거 누백들 바로 밑에 올해 나의 누백을 기록하시면 됩니다. 과거의 70%컷, 100%컷과 비교해서 매우 대략적으로 자신의 위치를 가늠할 수 있습니다. 사실 각 해의 누백은 서로 독립적인 것이어서 이렇게 묶어보는 것이 엄밀한 방법은 아닙니다. 주의하여 사용하시기 바랍니다. 분석기도 입시철에 계속 최신판이 나오는데, 최신 누백을 기록하고 싶으시다면, 그냥 기존 나의 누백을 지우고 새로운 나의 누백을 기록하면 됩니다. 이전 누백도 남기고 싶으시면, 메모란에 히스토리를 남겨놓으면 됩니다. (사실 누백은 라인 잡는 시기 이후로는 무용한 편이어서 굳이 세세하게 최신화하지 않아도 됩니다. 다만, 분석기를 철썩 같이 믿는 지원자들도 있어서, 하나의 변인으로 인정하고자 기록할 수 있는 공간을 마련한 것입니다.)
왼쪽 아래에는 나의 산출점수를 기록합니다. 변환표준점수 공개 이후 점수가 달라질 수 있는데, 이 경우는 위 누백과 달리, 반드시 새롭게 바뀐 자기 점수를 업데이트하시길 바랍니다.
내 점수 오른쪽에는 올해 모집인원을 기록합니다. 이 부분도 데이터가 최신화될 수 있습니다. 수시 이월 전에는 최초 모집인원이나 예측 모집인원을 사용하다가, 최종모집인원이 공개되면 수치를 바꿔주면 됩니다. 이러한 변동도 메모란에 변동일과 함께 기록해주시면 좋습니다.
모집인원을 기록하면, 과거데이터를 바탕으로 기대 추합인원, 기대 합격인원, 평균추합율, 기대지원자수, 평균경쟁률을 확인할 수 있습니다.
이 수치들을 설명하자면,
평균추합율은 그 위에 기입했던 ‘과거 추합율의 평균치’입니다.
‘기대 추합인원 = 최종모집인원 x 평균추합율’로 과거 정보를 바탕으로 올해 기대되는 추합인원을 구할 수 있습니다.
‘기대 합격총원 = 최종모집인원 + 기대 추합인원‘ 입니다.
평균경쟁률은 그 위에 기입했던 ‘과거 경쟁률의 평균치’입니다.
‘기대 지원자수 = 최종모집인원 x 평균경쟁률’이며, 과거 경쟁률을 바탕으로 올해 기대되는 지원자수를 구할 수 있습니다.
주의할 점은, 튀는 값이나 더 이상 유의미하지 않은 값이 존재할 수 있다는 점입니다. 모집 인원 변화, 군 이동, 학과 통폐합, 입시 제도 및 방식 변화, 폭빵, 마감 직전 절대적으로 낮았던 경쟁률 등등이 원인입니다. 이러한 히스토리를 알고 있느냐, 아웃라이어 등을 어떻게 처리할 것이냐가 ‘개인’의 실력이라고 할 수 있습니다.
다음은 본격적으로 수치들을 기록하는 부분입니다.
왼쪽에는 날짜를 기록합니다. 저는 12/30~1/5으로 7일간 한 번씩으로 예시 시트를 만들어드렸지만, 개인의 상황에 따라 날짜나 시간대를 더하거나 빼거나 하시면 됩니다. 그래도 마지막 3일간은 하루에 한 번씩은 기록하기를 권합니다.
입력해야 하는 정보는 예측 지표, 예측컷, 최초합격 가능 인원, 추가합격 가능 인원, 실제지원한 분석대상자수와 나의 등수, 나보다 하나 높은 칸까지의 인원수 내 칸의 꼴지의 순위, 나의 실제지원 등수 변화, 전체 모의지원자수와 그중 나의 전체 등수, 예측 지원자수, 적정 누백(점수)과 예상 누백(점수)입니다.
하나씩 설명드리면,
예측지표는 각자 자신이 보고 있는 지표를 입력하면 됩니다. 색깔일 수도 있고, 확률일 수도 있고, 0부터 9까지 숫자일 수도 있습니다. 모두가 보기 때문에 기록합니다.
예상점수는 예측컷입니다. 문을 닫을 것으로 예측되는 표본 인원의 점수일 것입니다.
최초합격 가능 인원은 지원 표본에서 최초합격으로 판단되는 인원수를 의미합니다.
추가합격 가능 인원은 지원 표본에서 추가합격으로 판단되는 인원수를 의미합니다. (합격 가능 인원 – 최초합 가능 인원)으로 구할 수도 있고, 편한 방식대로 기록하고 수식을 걸어주면 됩니다.
‘합격가능인원 = 최초합격 가능 인원 + 추가 합격 가능 인원’입니다.
나의 등수와 분석대상자수는 실지원이 예상되는 집계된 모의지원자수와 그 중 나의 순위입니다.
나의 위치는 '나의 등수 / 합격가능인원'을 백분위(%)로 표시하여 나타냅니다. 컷으로부터 나의 상대적인 위치를 가늠할 수 있습니다. 일반적으로 70%를 안정으로 봅니다. 보수적으로는 60%까지 잡을 때도 있습니다. 하지만 때로는 110%도 안정일 수 있습니다. 거시적으로 흐름을 읽는 것이 중요하고, 이 수치의 고평가와 저평가를 읽어내는 것이 실력입니다. 저희 노하우이기도 하고요. '개인'이 제일 어려움을 겪는 분야입니다.
나의 등수 변화는 그 이전에 기록한 ‘나의 등수’와 방금 기록한 '나의 등수'의 차이를 적는 것입니다. 등수가 앞으로 갔을 때 양수로 할 지, 음수로 할 지 등은 편한 방식대로 하시면 됩니다.
컷까지 인원은 나로부터 문 닫을 것으로 예상되는 사람까지 몇 명이 있는지입니다. 합격가능인원에서 나의 등수를 빼서 구합니다. 내 위로 몇 명이 들어오면 자신이 문을 닫게 되는지, 내 앞으로 몇명이 빠져야 내가 문을 닫을 것으로 예측되는지 확인할 수 있습니다.
오른쪽 아래에 윗지표 누적 인원과 내 지표 누적 인원은 표본 상에서 나보다 하나 높은 지표를 받은 꼴지의 순위와 나와 같은 지표를 받은 꼴지의 순위입니다. (본인이 보는 '예측지표'와 같은 지표를 의미합니다) 나의 등수와 비교하여 보면 나의 위치를 조금 더 잘 가늠할 수 있습니다.
전체등수와 전체지원자수는 그 학과를 모의지원한 모든 경쟁자들의 수와 자신의 순위입니다.
예측 지원자수는 예측되는 올해 지원자수입니다.
예측 지원자수를 기입하였다면, 상단에 기록했던 최종모집인원으로 나누어 예측 경쟁률을 구합니다.
적정 누백과 예상 누백은 많이들 보는 누백의 적정 누백(혹은 점수)과 예상 누백(혹은 점수)을 기록하면 됩니다. 적정 대신 소신을 이용하셔도 됩니다. 매번 기록할 정도로 중요도를 갖는 수치는 아닙니다. 굳이 안 보셔도 되고, 앞서 말했듯 누군가는 보기 때문에 같이 확인합니다.
마지막으로,
‘예측 표집비율 = 분석대상자수 / 예측지원자수’,
‘기대 표집비율 = 분석대상자수 / 기대지원자수’로 구합니다.
예측 표집비율과 기대 표집비율은 예측 혹은 기대치 대비 얼마만큼 표본에 경쟁자들이 확인되고 있는지를 확인시켜줍니다. 이 수치가 높다면, 이 학과에 대해 표본의 현실성이 높거나, 실제 표본이 외적·시스템적으로 ‘가정’된 정도를 넘어서고 있거나, 실제지원자들이 많이 들르고 있다는 뜻입니다.
수치들에 대해 설명했으니, 어떻게 보면 좋을지 간략히 다루겠습니다. 설명드렸듯, 수치는 거시적인 흐름이나 가정을 확인하기 위해 관찰하는 것입니다.
1. ‘과거를 바탕으로 기대되는 수치’와 ‘올해 보여지고 있는 수치’를 비교합니다. (통시적)
2. 어떤 정보가 실제 데이터가 아닌 추정에 의해 가정되고 있는지를 살핍니다. (가정)
3. ‘올해 보여지고 있는 수치’의 변화를 관찰합니다. (추이)
4. 하나의 학과가 아닌, 목표 지점의 좌우와 상하의 데이터를 같이 모아서 비교하며 살핍니다. (공시적)
5. 이를 통해, ‘나의 위치’를 ①구조적으로 ②상대적으로 확인하고, 내 경쟁자들이 무엇을 보고 있고, 어떤 판단, 행동, 추이를 보여주고 있는지 / 보일 것인지 잡아냅니다. (가설/시나리오 설정)
필요한 만큼, 가능한 만큼, 할 수 있는 만큼, 하고 싶은 만큼 하시면 됩니다. 부족하다고 생각되면 더 정보를 수집하면 되고, 과하게 느껴지면 덜어내면 됩니다.
커트라인 형성과 폭빵의 원리는 단순하지만, 현실에서 드러나는 양상과 시그널은 꽤나 다변적입니다. 지금까지 말씀드린 방법은 ‘개인’이 여러 상황에서 판을 읽고 능동적으로 판단하기 위해, 최소한으로 확인하면 좋을 ‘수치’들을 모으고 확인하는 방법이었습니다. 열심히 한다고 좋은 결과가 따라오는 것은 아니지만, 열심히 하면 최소한 손해보지는 않는 것이 입시입니다. 저의 이전 글들과 이어질 글을 읽으시면 조금 더 이해가 될 것입니다.
다음 글에서는 위 방법을 통해 실제 사례를 분석해보겠습니다. 감사합니다.
취소분 등의 올해 마지막 정시상담 예약 : 12월 11일 월요일
크럭스상담 우선권을 부여하는 예약신청서 작성 : https://zrr.kr/nERp
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
-
어떤게 맞음? 건대 다니는 애들이 '중시경건 외동홍'이라 하던데. 난 아직까진...
-
어캐 극복하죠..실전연습 해야되는건가…하 집모에선 항상 2인데…겁나 의미 없네
-
학회< 대체 뭐를 하는 데인가요…? 대충 주식스터디 비슷한건가..
-
음지를 알아버린 것
-
하나만 가져라
-
힙합 안해요 2
왜 랩하는사람인줄알죠 저를
-
놀랍게도 그 어떠한 것도 해낸 것이 없는 사람 1.
-
이미지적어주세여 1
닉많이바꿔서 알사람만 알겠지만 ㅎ
-
댓달면 이미지 써드림 47
순화 X 그냥 그대로 느낀거 적을거임
-
ㄹㅇ
-
입결, 아웃풋, 명성 등을 고려할 때 과연 대한민국 미대 원탑은?
-
과기대도 올라오고 숭실>국민이라고 하니... 단국대는 떡락중이라는 세간의 평가도...
-
사실 고려대, 중앙대랑 경희대는 너무 뻔한듯. 서강대는 가수냐 대통령이냐의 싸움 아닌가?
-
뭐가 더 빡셈? 리트는 올리기 어렵다고 듣긴 했는데 잘 몰라서
-
나 살기도 바쁜데 이상한 떡밥들에 시간쏟으면 피곤해지겠네
-
무휴반수생 무물 7
봉사 끝나기까지 기다리는데 심심해서 올려요 질문 안올라오면 5분뒤에 내리기~
-
이건 보통 어디를 선택하나요
-
지금 인문대라 상경으로 복전하려고 합니다..! 경영경제회계무역 이렇게 네개 중에서...
-
서울대 cc 0
Cc로 서울대 뚫으려면 공대보다 문과가 낫겠죠? 소수과가 많으니?
-
27번이 퀄모랑 겹친다는 소식이 들어왔습니다 아 진짜 눈물나네 왜 하필 아아 한 2주만 빨리낼걸
-
보통 그쯤에 모고 성적 어느정도 나오셨나요
-
서성한 질문 3
서강이 수학을 많이 본다는건 아는데 다른곳은 어느 과목 비중이 높은지 알 수 있을까요 ,,
-
대학 질문 12
화작 미적 영어 사문 지구 백분위 89 98 2 99 99 면 어디가능?
-
스피드를 누가 참음? ㅋㅋ
-
딱히 뭐라고 안하고 관심도 없는듯 과 까이고 안까이고 근들갑임 ㄹㅇ
-
반수고 뭐고 0
일단 귀찮아
-
정원이 많은 대형과이기 때문인가요?
-
어디감? 시립대 경희대
-
아아 안녕 나와쏘 제목에서 뼈 맞고 들어와찌? 먕 그래도 알 건 알아야 하니까^^...
-
의대 2000명 늘어나게 되면 한약수 일반교과가 유의미하게 뚫릴까요..
-
1. 서울대 인문 / 연고 공대 2. 서강 성균 경영 / 중앙 공대 3. 외대 문과...
-
댓글에 시립 경희 이화 건국 동국 홍익 아주
-
ㅈㄱㄴ
-
이젠 수도권에도 의대 정원 120명이 넘는 대형 의대가 무려 5개 대학이 되었습니다...
-
2천명이면 두배아님?
-
약사분들께 질문 49
일단 난 약까가 아니고 ㄹㅇ 약사가 미래가 안 보임 약사나 약대생분들은 전망 어떻게...
-
이제 다른 거 또 패러 갈 꺼임 유력후보 : 공무원, 교사 , 약사 <<< 국민들이...
-
두 나라 모두 점점 살기힘들어지고 망해간다하고 근데 출산율로보면 우리가 더...
-
수2 이런거 최신기출정도로 다시 보고싶은데 수분감 또 사긴 머ㅓ하고 교재에 풀이 다...
-
수능 수학 95점? 17
???
-
입시설명회에서 공개한 최근 3개년 아주대 입시결과(교과, 학종) 논술, 수시
-
여자친구는 없고 절 싫어하는 여자 동기는 있어요 소리없이 저를 언팔하는 미팅녀도...
-
연대자연 2
연세대 자연 정시 입결이 어느정도임??
-
이상한 소리 들리길래 무슨 소리인가 하고 봤더니 자기가 수학 2등급인데 어떤 n제를...
-
정시건대공대에서 컴공타이틀이 필요해서 하려는데 군대에서 준비해서 같은급간 동일과기준...
-
여사친이 보내줬는데 재밌네 1. 178이상 잘생 2. 연봉 7천이상 3. 음악할줄앎...
-
주요 대학 중에 방통대랑 이중학적 되는 대학 있나요 3
댓글로 알려주시면 확인해보고 맞으면 2000덕 드림
-
수시 : 학교 활동 열심히 함, 과 전공에 관심도 많음 정시 : 학교에 만족을...
-
구해요
-
사탐공대 2
확통 사탐으로 가능한 대학 (부경아인 선 위로) 알려주세요 ㅠㅠ
좋은글감사합니다
ㄹㅇ 좋은글.
110%는 10%의 오타인가요?
아닙니다. 해당 수치는 확률이 아니라 누적 등수 개념입니다.
40명 합격 가능할 때 44등이면 110%입니다. 구간 자체가 고평가되어 있으면 110%여도 안정~적정 카드일 수 있습니다. 그런곳을 잘 찾는것이 저희의 강점 중 하나입니다.
글 감사합니다
그런데 예측지원수는 마음대로 정하는 건가요?
많이들 보는 곳의 예측치입니다. 보조도구로써 역이용합니다. 이 예측치가 자꾸 틀려서그런지 작년부터 잘 공개하지 않습니다. 쪽지 주시면 보다 자세히 답변드리겠습니다!