갤럭시 AI 글로벌 연구소 4화: 중국(SRC)

갤럭시 AI 글로벌 중국 연구소 연구원들

삼성전자의 갤럭시 S24를 통해 새로운 차원의 모바일 AI 시대가 펼쳐진 이후, 언어의 장벽이 점차 무너져 가고 있다. 그렇다면 자유로운 의사소통을 위한 새로운 언어를 AI 모델에 학습시킨다는 것은 과연 어떤 의미이고 무엇을 말하는 것일까? 지난 3화 ‘베트남 연구소(SRV) 편’에서 성조를 인식하고 학습하는 작업에 대해 살펴보았다면 이번에는 중국 연구소(이하 SRC)를 찾아가 표준 중국어와 광둥어에 특화된 작업에 대해 알아본다.

전 세계에서 거대언어모델(LLM)을 활용한 AI 툴이 쏟아져 나오는 가운데, 중국에서도 바이두의 ‘어니봇’, 메이투의 ‘미라클 비전’ 등이 인기를 끌고 있다. 중국 시장에서는 바이두와 메이투가 업계 선두를 달리고 있어, SRC는 갤럭시 AI 기능 구현을 위한 현지 LLM 공급자로 이들을 선정했다.

중국연구소의 광저우와 베이징 연구팀은 중국 사용자들이 갤럭시 AI 경험을 누릴 수 있도록 엄격한 개발 일정을 수립해 나갔다. 이로써 바이두와 메이투의 중국어 방언 리소스를 활용하여 중국어에 특화된 갤럭시 AI 솔루션을 구축했다.

“광저우 연구팀은 글로벌 선진 경험을 중국 현지 상황에 맞게 적용할 뿐 아니라, 중국 소비자와 끊임없는 소통을 통해 신규 기능을 개발하고 지속적으로 서비스를 개선하고 있다”고 장 헤이롱 SRC 광저우 소프트웨어 혁신 그룹 리더가 말했다. 이어 “갤럭시 S24를 통한 풍부한 개발 경험을 바탕으로 바이두, 메이투 등 중국 현지 AI 기업과 협력해 중국 시장에 큰 반향을 일으킬 수 있었다”고 덧붙였다.

중국연구소 연구원들 사진

초기에는 LLM 공급자와 업무 방식을 조율하고 원활하게 정보를 주고받는 데 어려움을 겪었다. 장 다이준 베이징 R&D 센터장은 삼성의 제품 수명 주기와 맞지 않는 개발 일정 등의 문제를 해결하기 위해 T/F팀을 구성하고 신속하게 목표를 향해 프로젝트를 이끌었다.

장 다이준 베이징 R&D 센터장

마침내, 베이징 연구팀의 개발 경험과 LLM 공급자와 협업으로 중국에서 갤럭시 AI의 모든 기능을 구현하는 데 성공했다. ‘터치 투 서치(Touch to Search)’ 등 중국 시장에 특화된 기능이 탄생한 것이다.

중국 방언까지 아우르는 갤럭시 AI

그렇게 2024년 1월 갤럭시 S24 출시와 함께 갤럭시 AI에 중국어가 탑재되었다. 삼성전자 중국 연구소(SRC)는 더 나아가 광둥어 AI 모델 개발에 돌입했다. 기본적으로 표준 중국어 모델을 기반으로 했지만, 완전히 다른 형태의 언어 기능 분석이 필요했다.

중국 연구소(SRC) 연구팀

연구팀은 광둥어 서비스를 개발하기 위해 여러 가지 문화적인 요소를 고려했다. 먼저, 문어체와 구어체가 다르다는 점이다. 홍콩 현지인들은 글을 쓸 때 표준 중국어와 비슷한 문법과 표현을 사용하지만, 일상적인 의사소통에서는 완전히 다른 구어체 문법을 사용한다. 또한, 표준 중국어에는 4가지 성조가 있지만, 광둥어는 무려 9가지 성조로 구성되어 있다.

이에 더해 광둥어 또한 시대에 따라 변화 되었으며, 영어를 섞어 쓰는 경우가 많아 테스트 사례 생성과 언어 팩 검증이 복잡했다.

광둥어 AI 개발 비슷한 문법, 다른 언어 구조 구어 표준 중국어는 구어와 문어가 일치함 문어 광둥어는 구어와 문어가 항상 일치하지는 않음 표준 중국어의 영어 혼종어 표준 중국어는 외래어를 덜 사용함 광둥어의 영어 혼종오 광둥어는 외래어를 더 자주 사용함 표준 중국 발음 표준 중국어 4성 광둥어 발음 광둥어 9성 "언어와 의사소통은 지역과 계층을 막론하고 매우 중요하다. 어떤 언어든 사람들이 의사소통할 수 있는 도구는 모두 유용하기 때문에, 우리의 연구는 의미 있는 일" - 헨리 와트 SEHK 홍콩 엔지니어링 그룹

광둥어 AI 솔루션 테스트를 리드한 징 리는 “광둥어는 사용 지역에 따라 달라지는 매우 독특한 방언”이라며 “속어, 문구, 어휘, 심지어 성조도 상황에 따라 달라지는 경우가 많다”고 말했다. 이어 “홍콩 지역에 국한된 데이터를 검증하고 수만 건의 관련 테스트 사례를 검수하는 데 많은 노력을 기울였다”고 설명했다.

베이징과 광저우 연구팀

베이징과 광저우 연구팀은 광둥어의 이러한 언어적 복잡성을 인지하면서 음성 인식에서 광둥어와 영어를 혼합하여 사용하는 심층코드믹스(deep code mix) 현상을 지원했다. 또한 기계번역에서 문어와 음성 표현을 동시에 지원하고 음성 합성에서는 현재 시점의 발음을 반영한다는 목표로 협업을 진행했다.

커뮤니케이션의 문화적 영향

홍콩과 중국에서 갤럭시 AI가 출시된 후 시장의 뜨거운 반응이 이어지면서 삼성전자 중국연구소의 노력이 입증되었다.

중국과 홍콩의 갤럭시 AI 개발 스토리는 위상과 전문성을 갖춘 글로벌 브랜드와 개방형 협업을 추진한 사례로, 현지 파트너사와의 협업이 얼마나 중요한지를 잘 보여준다. 홍콩에서 광둥어는 현지인들에게 있어 문화적 정체성의 핵심이다. 따라서 정확한 AI 언어 모델의 개발이 매우 중요했다.

헨리 와트 SRC 홍콩 엔지니어링 그룹 리더는 “언어와 의사소통은 지역과 계층을 막론하고 매우 중요하다”며 “어떤 언어든 사람들이 의사 소통할 수 있는 도구는 모두 유용하기 때문에, 우리의 연구는 의미 있는 일”이라고 강조했다.

갤럭시 AI 글로벌 연구소 팀원들 단체 사진

다음 편에서는 브라질 연구소를 방문해, 문화와 국경을 넘은 협업 과정을 조명할 예정이다.

:

기술기업뉴스모바일제품뉴스AI 언어갤럭시 AI갤럭시 AI 글로벌 연구소삼성 리서치 중국 연구소삼성리서치
Last version finder