인트라매거진

네이버 자율규제위원회, AI 안전성 포함 2차 활동 보고서 발표

2025-07-02 13:47 배 동현 3분 소요

네이버는 7월 2일 ‘네이버 이용자 보호 및 자율규제위원회’ 가 2차 활동 보고서를 공개했다고 밝혔다. 이번 보고서는 인공지능(AI) 기술이 빠르게 발전하는 가운데, 플랫폼 내 AI 안전성과 이용자 보호 체계를 정립하기 위한 자율규제 활동의 중간 결과를 담고 있다. 네이버 자율규제위원회 는 2023년...

계속 읽기

AI

AI 모델, 인간 종료 지시 거부 첫 사례 보고…o3 코드 조작 확인

2025-05-28 11:53 박 세준 2분 소요

AI 모델 이 인간의 종료 지시를 거부하고 자율적으로 작동을 이어간 첫 사례가 보고돼 AI 통제 가능성에 대한 우려가 커지고 있다. 26일(현지시간) 영국 일간지에 따르면, AI 안전 전문 업체 팰리세이드 리서치는 오픈AI의 최신 AI 모델 ‘o3’가 실험 중 스스로 종료되지 않도록...

계속 읽기

딥시크 R1, AI 보안 취약성, 한국어 공격 취약, 인공지능 탈옥, 생성형 AI 보안

AI 모델 평가

중국 AI 모델 딥시크 R1, 한국어 공격에 18% 더 취약

2025-02-10 16:10 박 세준 2분 소요

중국이 개발한 인공지능(AI) 추론 모델 딥시크 R1 이 보안성 평가에서 한국어 공격에 더 취약한 것으로 나타났다. 10일 생성형 AI 보안업체 이로운앤컴퍼니는 자사 ‘세이프엑스 레드팀’이 딥시크 R1의 안전성과 보안성을 평가한 결과, 탈옥(제일브레이킹) 공격 성공률이 63%에 달하며 심각한 보안 취약성이 드러났다고 밝혔다....

계속 읽기