카카오, AI 가드레일 모델 ‘카나나 세이프가드’ 3종 오픈소스 공개

2025년 05월 27일

By 이 소율

카카오가 생성형 인공지능(AI) 서비스의 안전성과 신뢰성 강화를 위한 혁신적 기술을 선보이며 AI 생태계의
새로운 기준을 제시했다.

카카오는 자사의 자체 언어모델인 ‘카나나’를 기반으로 개발한 AI 가드레일 모델 ‘카나나 세이프가드(Kanana Safeguard)’ 3종을 국내 기업 최초로 오픈소스로 공개한다고 27일 밝혔다.

이번 공개는 AI 기술 발전과 함께 사회적으로 대두되는 유해 콘텐츠 문제에 대응하고, 한국어와 한국 문화에
최적화된 AI 안전장치 마련에 중점을 둔 중요한 행보로 평가된다.

최근 생성형 AI가 다양한 산업과 일상생활에 빠르게 확산되면서, AI를 통한 유해 정보, 개인정보 유출, 지식재산권 침해 등 여러 위험 요소가 증가하고 있다.

이에 따라 글로벌 빅테크 기업들이 AI 안전성을 보장하기 위한 가드레일 시스템을 구축하는 가운데,
카카오 역시 ‘카나나 세이프가드’ 개발을 통해 기술적 대응책을 마련했다.

이 시스템은 AI 서비스가 생성하는 콘텐츠의 위험성을 실시간으로 감지하고 차단할 수 있도록 설계되어,
보다 안전하고 신뢰할 수 있는 AI 환경을 조성하는 데 기여한다.

‘카나나 세이프가드’는 카카오가 자체 개발한 한국어 언어모델 ‘카나나’를 바탕으로 제작되었으며, 한국어와
한국 문화에 특화된 고성능 데이터셋을 활용해 국내 사용자 환경에 최적화된 성능을 자랑한다.

한국어 F1 스코어 평가에서 글로벌 경쟁 모델들을 능가하는 결과를 보이며, 국내 AI 서비스의 품질과 안전성을 한층 끌어올리는 역할을 하고 있다.

이번에 공개되는 ‘카나나 세이프가드’ 3종 모델은 각기 다른 유형의 위험 콘텐츠를 탐지하는 기능을 갖추고
있다.

첫 번째 모델 ‘카나나 세이프가드-기본’은 증오 발언, 괴롭힘, 성적 콘텐츠 등 명확한 유해 콘텐츠를 효과적으로 감지해 사용자 보호를 강화한다.

두 번째 ‘카나나 세이프가드-시렌(Siren)’은 개인정보 유출, 지식재산권 침해와 같은 법적 위험 요소를 탐지하는 데 초점을 맞췄다.

마지막으로 ‘카나나 세이프가드-프롬트(Prompt)’는 AI 악용 시도와 같은 비정상적 입력 패턴을 감지해 악의적 행위를 예방한다.

이들 모델은 AI 연구자와 개발자들이 자유롭게 활용할 수 있도록 허깅페이스(Hugging Face) 플랫폼을 통해 공개되어, 누구나 다운로드해 상업적 용도와 수정, 재배포가 가능하다.

카카오는 이번 오픈소스 공개에 아파치2.0(Apache 2.0) 라이선스를 적용해, 누구나 자유롭게 사용할 수
있는 환경을 제공하는 한편, 지속적인 모델 업데이트와 기능 고도화를 통해 AI 안전 기술의 발전을 견인할 계획이다.

이를 통해 카카오는 국내 AI 산업 전반의 성장과 더불어 사회적 책임을 다하는 모범적 기업으로서의 위상을
공고히 할 것으로 기대된다.

이번 발표에 대해 카카오 관계자는 “생성형 AI의 급격한 확산과 더불어 그에 따른 사회적 문제 역시 심화되고 있다”고 전했다.

이어 “카나나 세이프가드는 안전하고 신뢰할 수 있는 AI 서비스를 위한 필수적인 가드레일 모델로, 한국어 특화 고성능 시스템을 공개함으로써 국내외 AI 개발자와 연구자들이 함께 협력할 수 있는 기반을 마련했다”고 말했다.

또한 “앞으로도 기술적 혁신과 윤리적 책임을 동시에 추구하며 AI 생태계 전반의 안전성을 높이는 데 앞장서겠다”고 강조했다.

최근 AI 윤리와 안전 문제는 인공지능 기술 발전과 함께 가장 중요한 화두로 부상했다.

AI가 생성하는 콘텐츠가 사회적 갈등, 개인정보 침해, 허위 정보 확산 등에 악용될 가능성이 커지면서,
이를 통제하고 관리할 수 있는 기술적 장치에 대한 요구가 높아지고 있다.

이에 글로벌 기술 기업들은 자체적인 가드레일 시스템을 개발해 AI의 부작용을 최소화하는 데 주력하고 있으며, 카카오의 ‘카나나 세이프가드’ 공개는 이러한 글로벌 흐름에 발맞춘 중요한 조치로 평가된다.

또한 카카오가 공개한 가드레일 모델은 한국어와 한국 문화에 특화된 점이 가장 큰 차별화 요소다.

글로벌 AI 모델들이 주로 영어권 데이터에 집중하는 반면, 한국어 사용자를 위한 맞춤형 안전장치는 국내 AI 서비스의 질적 향상과 사용자 보호에 크게 기여할 것으로 예상된다.

이는 국내 AI 산업이 글로벌 경쟁에서 우위를 점하는 데에도 긍정적 영향을 미칠 것으로 기대된다.

카카오는 앞으로도 AI의 투명성과 공정성을 강화하고, 사용자의 안전을 최우선으로 하는 기술 개발에 지속 투자할 계획이다.

다양한 이해관계자와 협력해 AI 윤리 기준을 마련하고, 사회적 합의를 이끌어내는 데도 적극 참여할 방침이다.

이를 통해 카카오는 기술 혁신과 사회적 책임을 균형 있게 달성하는 ‘책임 있는 AI’ 기업으로 자리매김할 전망이다.

이번 ‘카나나 세이프가드’ 3종 모델의 공개는 AI 기술 활용의 새로운 전환점이 될 것으로 보인다.

개발자들은 자유롭게 모델을 활용해 각종 생성형 AI 서비스에 안전장치를 구현할 수 있으며, 사용자들은 보다 신뢰할 수 있는 AI 환경에서 서비스를 이용할 수 있게 된다.

이는 AI가 사회 전반에 긍정적인 영향을 미치고, 지속 가능한 발전을 이끄는 데 핵심적인 역할을 할 것으로
기대된다.

카카오가 공개한 AI 가드레일 모델은 앞으로 국내외 AI 개발자들과 연구자들에게 귀중한 자원이 될 것이며,
다양한 산업과 서비스 분야에서 AI의 안전한 활용을 촉진하는 기반이 될 것이다.

이를 통해 AI가 우리 사회에 더욱 널리 긍정적인 변화를 가져오는 데 기여할 수 있기를 기대한다.

다른기사보기

이소율 (lsy@sabanamedia.com) 기사제보

카테고리

검색

인기 검색어