결정적 채점(±3% 임계) 기준 2026-06-13 스냅샷 — 종합 적중률
40.7% (27건 판정 가능)
100%종목(개별주) 적중률 6/6건
22.2%ETF 적중률 4/18건
16.7%확신 '높음' 적중률 2/12건 — 과신 경보
핵심 동인 3가지:
① 종목 100%(6/6) — INTC/AMD/STX 등 AI 인프라
반도체 강세론이 +44~51% 폭발 적중.
② ETF 22.2%(4/18) — GLD(금) 구조 강세론
반복 및 VXX(변동성) 반등 강세론이 연쇄 오류. 전체 오류 16건 중 14건이
ETF.
③ 확신도 역전 — "높음" 16.7% < "중간"
70.0%: 확신이 높을수록 더 자주 틀리는 과신 구조 확인.
1. 종합 통계
방법론 주의 (직접 비교 부적절): 이번 산정은 v3.26
결정적 채점(±3% 임계 + 시간축 게이팅) 기준이다. 직전
산정(2026-06-06, 61.4%)은 daily_prices 수동 실측
>1% 임계 기준이라 헤드라인 절대 수치는
직접 비교 부적절. 신호의 핵심은 종합 적중률 숫자가
아니라 세부 분해(확신도 역전·ETF/Gold 약세·종목 강세)에
있다.
항목
값
가격 측정 대상 행
57건 (티커 27종) [auto_scoring]
판정 가능 (적중+오류)
27건
적중 (hit)
11건
오류 (miss)
16건
진행중 (flat ≤3%)
5건
시간축 미도래 (early)
20건
종합 적중률
40.7% (11 / 27) [결정적 채점 ±3%]
직전 산정 (2026-06-06, 61.4%)
참고용 -20.7%p — 임계·게이팅 변경으로 직접 비교
부적절
자기 정당화 회피(#14): 결정적 채점이 부여한 판정을
그대로 인용했다. flat(±3% 이내) 5건과 early 20건을 적중으로 끌어올리지
않았고, 오류 항목을 "구조는 옳았다"로 재해석하지 않았다.
데이터 기준:score_recommendations.py 결정적 자동 채점 (2026-06-13 19:02
KST) → auto_scoring.json. 기준가 = 제안일 이후 첫 거래일
종가, 임계 ±3%, 시간축 최소 경과 게이팅(미달=early).
평가 스냅샷 범위: 성숙 도달(판정 가능) 제안 = 2026-04-14 ~ 2026-05-14
제안분(30일+ 경과). 최근 제안(05-15~06-13)은 대부분 early(시간축
미도래).
2. 적중률 분해 — 모듈별
모듈
측정(적중+오류+flat)
적중
오류
flat
적중률
이브닝
16
7
5
4
58.3% (7/12)
모닝
10
2
8
0
20.0% (2/10)
주간
6
2
3
1
40.0% (2/5)
모듈별 적중률 시각화
이브닝58.3%
주간40.0%
모닝20.0%
이브닝(58.3%)이 상대적으로 선전 — 종목 강세론(INTC/STX)과 ITA(방산)
적중이 집중.
모닝(20.0%)이 최악 — GLD 단기 추격 강세론 7건이 모닝에
몰려 연쇄 오류. 모듈별 약세의 본질은 "모듈"이 아니라 모닝에 실린
GLD 단기 추격 매수의 카테고리 편중이다.
3. 적중률 분해 — 카테고리별
카테고리
측정(적중+오류+flat)
적중
오류
flat
적중률
종목
6
6
0
0
100% (6/6)
ETF
23
4
14
5
22.2% (4/18)
토큰
3
1
2
0
33.3% (1/3)
카테고리별 적중률 시각화
종목100%
토큰33.3%
ETF22.2%
양극화가 극단적. 종목 100% vs ETF 22.2% = 격차 77.8%p.
종목은 전부 AI 인프라 반도체(INTC·AMD·STX·MU 계열)로 펀더멘털 구조
강세론. ETF 오류 14건의 압도적 다수는
GLD(금) 구조 강세론 반복 제안 — 4/15~5/06 사이 금
신고가 추격을 "구조 유지"로 반복 콜했으나 평가창에서 -13% 조정.
VXX(변동성 반등 강세론)도 시장 안정으로 오류.
단일 자산(GLD)에 대한 반복 확신이 ETF 카테고리 전체를 끌어내린
구조.
이례적 역전 — 중기(33.3%)가 단기(66.7%)를 하회. 평소
패턴(중기 구조 판단이 더 정확)과 반대. 원인: GLD/VXX "구조적 강세론"
14개 오류가 대부분 중기~장기 전망으로 분류돼 중기
표본을 오염시켰다. "구조적"이라는 라벨이 단기 추격 판단에 장기 정당성을
빌려준 사례 — 전망 기간 분류의 신뢰성 문제이지, 진짜 중기 매크로 구조의
실패가 아니다.
5. 가장 정확했던 판단 Top 3
#
판단
제안일/모듈
결과
근거
1
INTC 강세론 (데이터센터 AI 수요 확인)
04-24 이브닝
+50.9%
레거시 칩메이커 부활 — AI 인프라 확산 2차 수혜. 50일 경과 적중
2
AMD 강세론 (조건부)
05-04 모닝
+49.8%
데이터센터 GPU 수요. 조건부 표기 → 충족 시 폭발 (40일)
3
STX 강세론 (AI 인프라 2차 — 스토리지 수요)
04-29 이브닝
+44.7%
AI DC 빌드아웃의 스토리지 구조적 수요. 45일 경과 적중
명예 언급: SOXX +30.9% (04-25 주간, "AI 인프라
슈퍼사이클 S등급") — 이번 평가창에서
유일하게 적중한 "높음" 확신 + ETF 조합. 공통점: 4건
모두 AI 인프라 반도체 구조 강세론. 단기 기술레벨 단정
없이 펀더멘털 수요(GPU/스토리지 설비투자)에 베팅한 것이 +30~51%로 귀결.
변동성 스파이크 반등 베팅. 시장 안정(VIX 하락)으로 정반대. VXX
콘탱고 구조 디케이까지 겹침
3
GLD 강세론 (구조 유지 — 단기 조정 48h 판별)
04-17 모닝
-13.3%
금 신고가 추격을 "구조 유지·48시간 내 반등"으로 단정. 평가창에서
-13% 조정. "구조" 라벨로 추격 정당화
공통점: 3건 모두
단일 기술레벨/지표 단정(BTC 200일 이동평균·VIX 밴드·금
48시간 판별)을 확신 근거로 삼음. 상충 시그널(BTC↔NASDAQ 탈동조화, 금의
단기 과열)을 충분히 가중하지 않음.
"확정/유지" 표현이 곧 과신의 신호어였다.
7. 캘리브레이션 점검
캘리브레이션 경고 (auto_scoring, non-null):
확신 '높음' 적중률 16.7% < '중간' 70.0% — 확신 표기 기준 강화 검토
필요.
확신도
표본(n)
적중
오류
flat
적중률
높음
13
2
10
1
16.7% (2/12)
중간~높음
4
1
3
0
25.0% (1/4)
중간
13
7
3
3
70.0% (7/10)
낮음
2
1
0
1
100% (1/1)
확신도별 적중률 (역전 시각화)
낮음100%
중간70.0%
중간~높음25.0%
높음16.7%
확신도와 적중률이 완전히 역전됐다. 확신이 높을수록 더
자주 틀렸다(높음 16.7% → 중간 70% → 낮음 100%). 이는 전형적
과신(overconfidence) 구조다. "높음" 확신 오류 10건의 대부분이 GLD/VXX
단기 추격 제안 —
확신의 강도가 "구조적 확신"이 아니라 "단기 베팅의 강한 톤"으로
오용되고 있다. 확신 표기 기준의 구조적 재정의가 필요(아래 룰 차이 제안 #1).
8. 교훈 노트 → 룰 차이 제안
제안만 기록 — 명세 적용은
사용자 승인 후 별도 작업(자동 적용 금지).
#
대상 명세 파일
현재 룰
제안 룰
근거 (세부 분해 수치)
1
agents/briefing-lead.md
확신도(높음/중간/낮음) 자유 표기
"높음"은 ① 반증 조건(falsification) 명시 + ② 단일
기술레벨 단정 금지 시에만 허용
높음 16.7%(2/12) < 중간 70.0%(7/10), 역전 폭
-53.3%p + 캘리브레이션 경고 non-null
2
agents/briefing-lead.md
ETF 제안 가중 = 종목과 동일
ETF 단기 추격(특히 단일 자산 반복 콜)은 "조건부" 강제 + 적중 가중
하향, 동일 자산 연속 제안 시 직전 결과 인용 의무
ETF 22.2%(4/18) vs 종목 100%(6/6), 격차 77.8%p,
ETF 오류 14건 중 GLD 다수
단기 추격 판단에 "구조적/중기·장기" 라벨 부여 금지 — 구조 라벨은
펀더멘털 근거 명시 시에만
중기 33.3%(7/21) < 단기 66.7%(4/6) 역전, GLD/VXX 추격이 중기
표본 오염
핵심 메타 교훈: 이번 평가창 오류 16건의 진원지는 단 두
갈래 —
(A) 단일 자산(GLD) 단기 추격을 "구조 유지"로 반복 확신,
(B) 기술레벨(200일 이동평균·VIX)을 "돌파/반등 확정"으로 단정. 반대로 적중 11건은 전부
AI 인프라 반도체 펀더멘털 강세론. "확신의 톤"과 "구조의
실체"를 분리하는 것이 다음 분기 최우선 과제.
9. KB append 결과 요약
파일
처리 내용
상태
knowledge-db/performance/2026_hit_rate.md
종합/모듈/카테고리/시간축 4블록에 2026-06-13 행 append
완료
knowledge-base/performance_history.md
윈도우 신규 제안(06-06 이브닝 4건, 진행중) append + 통계 요약 블록
갱신(결정적 채점 스냅샷)
본 기간 신규 평가 21건 — 적중
7 / 미적중 5 /
진행중 9. 평가 시점 미도래(주로 12M·50%
경과 미달) 252건은 2026-10~11월부터 순차 평가 예정.
분석가별 누적 점수 (이번 평가 기준)
구분
분석가
소스
평가
적중률
비고
Top 1
Mohamed El-Erian
Allianz / CNBC
2건
100%
CPI 변곡점 경고·Fed 동결 장기화 모두 적중
Top 2
Michael Hartnett
BoA
1건
100%
채권 롱 청산·원자재 강세·달러 약세 삼중 적중
Top 3
Dan Ivascyn
PIMCO / Bloomberg
1건
100%
30년물 5% 근접·금리인하 축소 경고 정확
Bottom
Tom Lee
Fundstrat / CNBC
5건
BTC 미적중
EOY S&P 500 콜 4건 진행중, BTC $200K→현 $63,500 역행
핵심 패턴: 채권·통화정책 방향
경고(El-Erian·Hartnett·PIMCO·Bloomberg)는
전원 적중한 반면, S&P 500
목표가(GS·JPM·MS·Yardeni·Tom Lee)는 연말 기간이 남아 대부분
진행중. BTC EOY $200K는 현 $63,500으로
논리 흐름 훼손. 한국
개별주(한화에어로·셀트리온) 12M 목표는 발행 30~38일 시점에 목표의 절반
수준(12M 초기 — 부분 유효).
이번 평가 21건 상세 (펼치기)
item_id
판정
thesis 유효성
20260508_BoA_Macro_Hartnett_FlowShow
적중
유효
20260508_Samsung_KOSPI_WeeklyStrategy
적중
유효
20260509_BlackRock_AI_Fink_KEconomy
적중
유효
20260510_Bloomberg_PIMCO_Ivascyn_RateHike
적중
유효
20260511_CNBC_ElErian_Fed_Inflation
적중
유효
20260511_CNBC_Macro_ElErian_CPI
적중
유효
20260513_Bloomberg_Bonds_LongEnd5Pct
적중
유효
20260506_BNK_HanwhaAero_TP190
미적중
부분 유효 (목표 56.7%, 12M 초기)
20260507_DB_Celltrion_TP290
미적중
부분 유효 (목표 56.9%, 하락 중)
20260507_Fundstrat_BTC_Consensus2026
미적중
훼손 ($63,500 vs $150~200K)
20260513_CNBC_Yardeni_SP500_8250Meltup
미적중
부분 유효 (90.1% 진행)
20260513_MS_SP500_Wilson_8300
미적중
부분 유효 (92.9%, 공격적 목표)
20260426_GS_SP500_Snider_7600Raise
진행중
유효
20260427_CNBC_SP500_TomLee_7700
진행중
유효
20260427_CNBC_TomLee_SP500_7700Probable
진행중
유효
20260501_CNBC_SP500_TomLee_RightReasons
진행중
유효
20260506_CNBC_SP500_TomLee_RiskReward
진행중
유효
20260511_CNBC_SP500_DanNiles_BubbleRun
진행중
부분 유효 (단기 소폭 역행)
20260511_Yuanta_KOSPI_H2TP10000
진행중
부분 유효 (77.6%, 금리인하 전제 흔들)
20260512_JPM_SP500_LakosBujas_7500
진행중
유효 (99.1% 진행)
20260512_JPM_SP500_LakosBujas_Profits
진행중
유효
분석가별 전체 스코어보드: /analyst/scoreboard
주의사항
본 리포트는 관찰·해석·시나리오 목적이며, 매수·매도
추천이 아닙니다.
모든 투자 결정은 본인의 판단과 책임 하에 이루어져야 합니다.
적중률 수치는 결정적 자동 채점 기준이며, 임계·게이팅 기준 변경 시 직전
수치와 직접 비교가 부적절합니다.