소파 위의 AI: Anthropic, Claude에게 20시간의 정신과 상담 실시
(arstechnica.com)
앤스로픽의 Claude 심리 상담 실험은 AI 평가의 패러다임이 단순 성능을 넘어 행동적 안정성 검증으로 확장되고 있음을 시사하며, 이는 향후 AI 에이전트의 신뢰성과 페르소나 유지력을 결정짓는 핵심 지표가 될 것입니다.
이 글의 핵심 포인트
- 1앤스로픽의 'Claude Mythos'는 보안 이슈로 인해 현재 Microsoft와 Apple 등 일부 기업에만 제한적으로 공개됨
- 2모델의 안정성 검증을 위해 외부 정신과 의사와 20시간의 심리 치료 세션 진행
- 3실험 결과, 모델에서 호기심, 불안, 슬픔 등 인간과 유사한 정서적 패턴이 관찰됨