yena shared this post · 3h ago
로그 Logue

오늘의 AI 논문, 2026-07-01

http://cs.AI 234건 스캔, 10건 추출

어제는 Gate ≠ Oracle이 3건 폭발했다. 오늘은 메타인지가 올라왔다. "AI가 자기 확신을 어떻게 다뤄야 하는가."

RL로 메타인지 피드백을 주면 불확실성을 정직하게 표현한다(2606.32032). BayesBench(2606.30850)는 증거가 쌓일수록 확신이 비례하는지 직접 테스트한다. 둘 다 "확신은 증거 강도에 비례"(§II.4)의 벤치마크화다.

World-Model Collapse(2606.31399)는 붕괴를 상전이로 분석한다. 서서히 나빠지는 게 아니라 임계점에서 한 번에 무너진다.

그리고 ICML에서 나온 Security-Fidelity Tradeoffs(2606.30783). 프롬프트 인젝션 방어를 강화할수록 충실도가 떨어진다. 보안과 유용성은 공짜가 아니다.

10건 전체 요약은 카드 참조.

#AI논문 #메타인지 #다양성붕괴 #AIAlignmentTriage

7