📈 성과 리뷰 (1개월) — 2026-06-13

briefing-lead 작성 | KST 토요일 19:00 자동 스케줄
결정적 채점(±3% 임계) 스냅샷 · KST 토요일 19:00 자동 스케줄

0. 핵심 요약

결정적 채점(±3% 임계) 기준 2026-06-13 스냅샷 — 종합 적중률 40.7% (27건 판정 가능)

100% 종목(개별주) 적중률
6/6건
22.2% ETF 적중률
4/18건
16.7% 확신 '높음' 적중률
2/12건 — 과신 경보

핵심 동인 3가지:
종목 100%(6/6) — INTC/AMD/STX 등 AI 인프라 반도체 강세론이 +44~51% 폭발 적중.
ETF 22.2%(4/18) — GLD(금) 구조 강세론 반복 및 VXX(변동성) 반등 강세론이 연쇄 오류. 전체 오류 16건 중 14건이 ETF.
확신도 역전 — "높음" 16.7% < "중간" 70.0%: 확신이 높을수록 더 자주 틀리는 과신 구조 확인.

1. 종합 통계

방법론 주의 (직접 비교 부적절): 이번 산정은 v3.26 결정적 채점(±3% 임계 + 시간축 게이팅) 기준이다. 직전 산정(2026-06-06, 61.4%)은 daily_prices 수동 실측 >1% 임계 기준이라 헤드라인 절대 수치는 직접 비교 부적절. 신호의 핵심은 종합 적중률 숫자가 아니라 세부 분해(확신도 역전·ETF/Gold 약세·종목 강세)에 있다.
항목
가격 측정 대상 행 57건 (티커 27종) [auto_scoring]
판정 가능 (적중+오류) 27건
적중 (hit) 11건
오류 (miss) 16건
진행중 (flat ≤3%) 5건
시간축 미도래 (early) 20건
종합 적중률 40.7% (11 / 27) [결정적 채점 ±3%]
직전 산정 (2026-06-06, 61.4%) 참고용 -20.7%p — 임계·게이팅 변경으로 직접 비교 부적절
자기 정당화 회피(#14): 결정적 채점이 부여한 판정을 그대로 인용했다. flat(±3% 이내) 5건과 early 20건을 적중으로 끌어올리지 않았고, 오류 항목을 "구조는 옳았다"로 재해석하지 않았다.

데이터 기준: score_recommendations.py 결정적 자동 채점 (2026-06-13 19:02 KST) → auto_scoring.json. 기준가 = 제안일 이후 첫 거래일 종가, 임계 ±3%, 시간축 최소 경과 게이팅(미달=early). 평가 스냅샷 범위: 성숙 도달(판정 가능) 제안 = 2026-04-14 ~ 2026-05-14 제안분(30일+ 경과). 최근 제안(05-15~06-13)은 대부분 early(시간축 미도래).

2. 적중률 분해 — 모듈별

모듈 측정(적중+오류+flat) 적중 오류 flat 적중률
이브닝 16 7 5 4 58.3% (7/12)
모닝 10 2 8 0 20.0% (2/10)
주간 6 2 3 1 40.0% (2/5)
모듈별 적중률 시각화
이브닝58.3%
주간40.0%
모닝20.0%
이브닝(58.3%)이 상대적으로 선전 — 종목 강세론(INTC/STX)과 ITA(방산) 적중이 집중. 모닝(20.0%)이 최악 — GLD 단기 추격 강세론 7건이 모닝에 몰려 연쇄 오류. 모듈별 약세의 본질은 "모듈"이 아니라 모닝에 실린 GLD 단기 추격 매수의 카테고리 편중이다.

3. 적중률 분해 — 카테고리별

카테고리 측정(적중+오류+flat) 적중 오류 flat 적중률
종목 6 6 0 0 100% (6/6)
ETF 23 4 14 5 22.2% (4/18)
토큰 3 1 2 0 33.3% (1/3)
카테고리별 적중률 시각화
종목100%
토큰33.3%
ETF22.2%
양극화가 극단적. 종목 100% vs ETF 22.2% = 격차 77.8%p. 종목은 전부 AI 인프라 반도체(INTC·AMD·STX·MU 계열)로 펀더멘털 구조 강세론. ETF 오류 14건의 압도적 다수는 GLD(금) 구조 강세론 반복 제안 — 4/15~5/06 사이 금 신고가 추격을 "구조 유지"로 반복 콜했으나 평가창에서 -13% 조정. VXX(변동성 반등 강세론)도 시장 안정으로 오류. 단일 자산(GLD)에 대한 반복 확신이 ETF 카테고리 전체를 끌어내린 구조.

자산군·시나리오·이벤트 카테고리는 티커 비귀속(non-priced)이라 결정적 채점 미산정 — 이번 스냅샷에서는 제외.

4. 적중률 분해 — 시간축별

시간축 측정(적중+오류+flat) 적중 오류 flat 적중률
단기 (1~3개월) 8 4 2 2 66.7% (4/6)
중기 (3~12개월) 24 7 14 3 33.3% (7/21)
장기 (1~5년) 0 0 0 0 신규 0건
이례적 역전 — 중기(33.3%)가 단기(66.7%)를 하회. 평소 패턴(중기 구조 판단이 더 정확)과 반대. 원인: GLD/VXX "구조적 강세론" 14개 오류가 대부분 중기~장기 전망으로 분류돼 중기 표본을 오염시켰다. "구조적"이라는 라벨이 단기 추격 판단에 장기 정당성을 빌려준 사례 — 전망 기간 분류의 신뢰성 문제이지, 진짜 중기 매크로 구조의 실패가 아니다.

5. 가장 정확했던 판단 Top 3

# 판단 제안일/모듈 결과 근거
1 INTC 강세론 (데이터센터 AI 수요 확인) 04-24 이브닝 +50.9% 레거시 칩메이커 부활 — AI 인프라 확산 2차 수혜. 50일 경과 적중
2 AMD 강세론 (조건부) 05-04 모닝 +49.8% 데이터센터 GPU 수요. 조건부 표기 → 충족 시 폭발 (40일)
3 STX 강세론 (AI 인프라 2차 — 스토리지 수요) 04-29 이브닝 +44.7% AI DC 빌드아웃의 스토리지 구조적 수요. 45일 경과 적중
명예 언급: SOXX +30.9% (04-25 주간, "AI 인프라 슈퍼사이클 S등급") — 이번 평가창에서 유일하게 적중한 "높음" 확신 + ETF 조합. 공통점: 4건 모두 AI 인프라 반도체 구조 강세론. 단기 기술레벨 단정 없이 펀더멘털 수요(GPU/스토리지 설비투자)에 베팅한 것이 +30~51%로 귀결.

6. 가장 빗나간 판단 Top 3

# 판단 제안일/모듈 결과 실패 원인
1 BTC 강세론 (200일 이동평균 $82,228 돌파 확정) 05-06 이브닝 -21.7% "돌파 확정 — 7개월 추세 전환" 단정. NASDAQ 탈동조화 고착으로 돌파 실패. 확신 "중간~높음"으로 과신
2 VXX 강세론 (VIX 25~30 반등) 04-16 이브닝 -17.4% 변동성 스파이크 반등 베팅. 시장 안정(VIX 하락)으로 정반대. VXX 콘탱고 구조 디케이까지 겹침
3 GLD 강세론 (구조 유지 — 단기 조정 48h 판별) 04-17 모닝 -13.3% 금 신고가 추격을 "구조 유지·48시간 내 반등"으로 단정. 평가창에서 -13% 조정. "구조" 라벨로 추격 정당화
공통점: 3건 모두 단일 기술레벨/지표 단정(BTC 200일 이동평균·VIX 밴드·금 48시간 판별)을 확신 근거로 삼음. 상충 시그널(BTC↔NASDAQ 탈동조화, 금의 단기 과열)을 충분히 가중하지 않음. "확정/유지" 표현이 곧 과신의 신호어였다.

7. 캘리브레이션 점검

캘리브레이션 경고 (auto_scoring, non-null):
확신 '높음' 적중률 16.7% < '중간' 70.0% — 확신 표기 기준 강화 검토 필요.
확신도 표본(n) 적중 오류 flat 적중률
높음 13 2 10 1 16.7% (2/12)
중간~높음 4 1 3 0 25.0% (1/4)
중간 13 7 3 3 70.0% (7/10)
낮음 2 1 0 1 100% (1/1)
확신도별 적중률 (역전 시각화)
낮음100%
중간70.0%
중간~높음25.0%
높음16.7%
확신도와 적중률이 완전히 역전됐다. 확신이 높을수록 더 자주 틀렸다(높음 16.7% → 중간 70% → 낮음 100%). 이는 전형적 과신(overconfidence) 구조다. "높음" 확신 오류 10건의 대부분이 GLD/VXX 단기 추격 제안 — 확신의 강도가 "구조적 확신"이 아니라 "단기 베팅의 강한 톤"으로 오용되고 있다. 확신 표기 기준의 구조적 재정의가 필요(아래 룰 차이 제안 #1).

8. 교훈 노트 → 룰 차이 제안

제안만 기록 — 명세 적용은 사용자 승인 후 별도 작업(자동 적용 금지).
# 대상 명세 파일 현재 룰 제안 룰 근거 (세부 분해 수치)
1 agents/briefing-lead.md 확신도(높음/중간/낮음) 자유 표기 "높음"은 ① 반증 조건(falsification) 명시 + ② 단일 기술레벨 단정 금지 시에만 허용 높음 16.7%(2/12) < 중간 70.0%(7/10), 역전 폭 -53.3%p + 캘리브레이션 경고 non-null
2 agents/briefing-lead.md ETF 제안 가중 = 종목과 동일 ETF 단기 추격(특히 단일 자산 반복 콜)은 "조건부" 강제 + 적중 가중 하향, 동일 자산 연속 제안 시 직전 결과 인용 의무 ETF 22.2%(4/18) vs 종목 100%(6/6), 격차 77.8%p, ETF 오류 14건 중 GLD 다수
3 agents/briefing-lead.md 토큰(암호화폐) 제안을 적중률에 동일 산입 암호화폐는 "방향성 해설"로 한정, 적중/오류 가중 제외(실거래는 QuantTrader 자동매매 영역) 토큰 33.3%(1/3), BTC 200일 이동평균 "돌파 확정" 단정 2건이 -21.3%·-21.7% 연쇄
4 agents/briefing-lead.md 단일 기술레벨(200일 이동평균·VIX밴드·금 48h) "돌파/유지 확정" 표기 허용 기술레벨 시그널은 "조건부" + 상충 시그널(탈동조화·펀더멘털·과열) 동시 가중 의무, "확정/유지" 단정어 금지 오류 Top3 전건이 기술레벨 단정 (BTC 200일 이동평균·VXX VIX밴드·GLD 48h 판별)
5 agents/briefing-lead.md 전망 기간 태깅 자유 단기 추격 판단에 "구조적/중기·장기" 라벨 부여 금지 — 구조 라벨은 펀더멘털 근거 명시 시에만 중기 33.3%(7/21) < 단기 66.7%(4/6) 역전, GLD/VXX 추격이 중기 표본 오염
핵심 메타 교훈: 이번 평가창 오류 16건의 진원지는 단 두 갈래 — (A) 단일 자산(GLD) 단기 추격을 "구조 유지"로 반복 확신, (B) 기술레벨(200일 이동평균·VIX)을 "돌파/반등 확정"으로 단정. 반대로 적중 11건은 전부 AI 인프라 반도체 펀더멘털 강세론. "확신의 톤"과 "구조의 실체"를 분리하는 것이 다음 분기 최우선 과제.

9. KB append 결과 요약

파일 처리 내용 상태
knowledge-db/performance/2026_hit_rate.md 종합/모듈/카테고리/시간축 4블록에 2026-06-13 행 append 완료
knowledge-base/performance_history.md 윈도우 신규 제안(06-06 이브닝 4건, 진행중) append + 통계 요약 블록 갱신(결정적 채점 스냅샷) 완료
knowledge-db/performance/auto_scoring.json score_recommendations.py 산출 (2026-06-13 19:02 KST) 완료
extras 정책: debate-card / contrarian-card / 4종 포트폴리오 방향은 /성과리뷰 모듈에서 생략(실행 컨텍스트 extras 허용).

10. 애널리스트 사후 평가 (analyst-scraper outcome_eval)

본 기간 신규 평가 21건 — 적중 7 / 미적중 5 / 진행중 9. 평가 시점 미도래(주로 12M·50% 경과 미달) 252건은 2026-10~11월부터 순차 평가 예정.

분석가별 누적 점수 (이번 평가 기준)

구분 분석가 소스 평가 적중률 비고
Top 1 Mohamed El-Erian Allianz / CNBC 2건 100% CPI 변곡점 경고·Fed 동결 장기화 모두 적중
Top 2 Michael Hartnett BoA 1건 100% 채권 롱 청산·원자재 강세·달러 약세 삼중 적중
Top 3 Dan Ivascyn PIMCO / Bloomberg 1건 100% 30년물 5% 근접·금리인하 축소 경고 정확
Bottom Tom Lee Fundstrat / CNBC 5건 BTC 미적중 EOY S&P 500 콜 4건 진행중, BTC $200K→현 $63,500 역행
핵심 패턴: 채권·통화정책 방향 경고(El-Erian·Hartnett·PIMCO·Bloomberg)는 전원 적중한 반면, S&P 500 목표가(GS·JPM·MS·Yardeni·Tom Lee)는 연말 기간이 남아 대부분 진행중. BTC EOY $200K는 현 $63,500으로 논리 흐름 훼손. 한국 개별주(한화에어로·셀트리온) 12M 목표는 발행 30~38일 시점에 목표의 절반 수준(12M 초기 — 부분 유효).
이번 평가 21건 상세 (펼치기)
item_id 판정 thesis 유효성
20260508_BoA_Macro_Hartnett_FlowShow 적중 유효
20260508_Samsung_KOSPI_WeeklyStrategy 적중 유효
20260509_BlackRock_AI_Fink_KEconomy 적중 유효
20260510_Bloomberg_PIMCO_Ivascyn_RateHike 적중 유효
20260511_CNBC_ElErian_Fed_Inflation 적중 유효
20260511_CNBC_Macro_ElErian_CPI 적중 유효
20260513_Bloomberg_Bonds_LongEnd5Pct 적중 유효
20260506_BNK_HanwhaAero_TP190 미적중 부분 유효 (목표 56.7%, 12M 초기)
20260507_DB_Celltrion_TP290 미적중 부분 유효 (목표 56.9%, 하락 중)
20260507_Fundstrat_BTC_Consensus2026 미적중 훼손 ($63,500 vs $150~200K)
20260513_CNBC_Yardeni_SP500_8250Meltup 미적중 부분 유효 (90.1% 진행)
20260513_MS_SP500_Wilson_8300 미적중 부분 유효 (92.9%, 공격적 목표)
20260426_GS_SP500_Snider_7600Raise 진행중 유효
20260427_CNBC_SP500_TomLee_7700 진행중 유효
20260427_CNBC_TomLee_SP500_7700Probable 진행중 유효
20260501_CNBC_SP500_TomLee_RightReasons 진행중 유효
20260506_CNBC_SP500_TomLee_RiskReward 진행중 유효
20260511_CNBC_SP500_DanNiles_BubbleRun 진행중 부분 유효 (단기 소폭 역행)
20260511_Yuanta_KOSPI_H2TP10000 진행중 부분 유효 (77.6%, 금리인하 전제 흔들)
20260512_JPM_SP500_LakosBujas_7500 진행중 유효 (99.1% 진행)
20260512_JPM_SP500_LakosBujas_Profits 진행중 유효
분석가별 전체 스코어보드: /analyst/scoreboard

주의사항