2026.06.18 (목)

  • 맑음동두천 26.8℃
  • 맑음강릉 27.5℃
  • 맑음서울 28.6℃
  • 흐림대전 25.0℃
  • 구름많음대구 26.7℃
  • 맑음울산 27.1℃
  • 구름많음광주 26.9℃
  • 구름많음부산 25.6℃
  • 구름많음고창 25.8℃
  • 흐림제주 24.1℃
  • 맑음강화 26.7℃
  • 구름많음보은 24.7℃
  • 구름많음금산 24.2℃
  • 맑음강진군 27.6℃
  • 구름많음경주시 28.4℃
  • 구름많음거제 26.2℃
기상청 제공

AI platform

KT, 다국어 AI 안전성 평가 벤치마크 공개

투데이e코노믹 = 유서진 기자 | KT가 글로벌 기업과 공공기관, 학계와 함께 대규모 언어모델의 안전성과 문화적 민감성을 함께 평가할 수 있는 다국어 벤치마크를 공개했다.

 

KT는 한국, 미국, 독일, 일본, 튀르키예, 아랍에미리트 등 10개국의 언어와 문화적 특성을 반영한 다국어 벤치마크 ‘XL-세이프티벤치’를 공개했다고 4일 밝혔다.

 

XL-세이프티벤치는 대규모 언어모델이 각 언어권에서 위험하거나 부적절한 답변을 얼마나 잘 피하는지, 또 지역별 문화와 사회적 맥락을 얼마나 정확하게 이해하는지를 평가하기 위해 개발됐다. 총 5500개 규모의 프롬프트로 구성됐으며, 단순 번역 수준을 넘어 국가별 언어 표현과 문화적 차이까지 반영한 것이 특징이다.

 

최근 생성형 AI 활용이 전 세계로 확산되면서 AI 안전성 평가는 영어 중심 기준만으로는 한계가 있다는 지적이 제기돼 왔다. 같은 질문이라도 국가와 문화권에 따라 민감하게 받아들여질 수 있는 표현이 다르고, 사회적 금기나 법·제도적 기준도 차이가 있기 때문이다.

 

KT는 이번 벤치마크를 통해 비영어권 환경에서도 AI 모델의 안전성과 신뢰성을 체계적으로 검증할 수 있을 것으로 기대하고 있다. 특히 한국어를 포함한 여러 언어권 데이터를 반영함으로써 국내 AI 생태계의 평가 기반을 넓히는 데도 의미가 있다는 설명이다.

 

벤치마크 데이터셋과 평가 코드는 AI 모델·데이터 공유 플랫폼 허깅페이스와 오픈소스 개발 협업 플랫폼 깃허브를 통해 공개됐다. 연구자와 개발자, 기업은 이를 활용해 자체 AI 모델의 안전성을 점검하거나 기존 모델과 성능을 비교할 수 있다.

 

KT는 이번 공개가 글로벌 AI 안전성 논의에 국내 기업이 주도적으로 참여한 사례라는 점에도 의미를 두고 있다. AI 모델의 성능 경쟁이 치열해지는 가운데, 단순한 답변 정확도뿐 아니라 안전성, 편향성, 문화적 이해도까지 함께 평가하는 흐름이 강화되고 있어서다.

 

KT 관계자는 “XL-세이프티벤치는 다양한 언어와 문화권에서 AI가 안전하고 책임 있게 작동하는지를 평가하기 위한 기반”이라며 “앞으로도 글로벌 협력을 통해 신뢰할 수 있는 AI 생태계 조성에 기여하겠다”고 말했다.