전체메뉴 검색
IT

LG유플러스, AWS 기반 AI 운영 플랫폼 구축…GPU 효율화·운영 자동화

류청빛 기자 2026-04-10 09:34:12

AI 개발·배포·운영 전 과정 통합…서비스 안정성 강화

생성형 AI 확대 대응…AI 인프라 효율성 개선

허설 LG유플러스 MLOps개발팀 기술책임이 '2026 모던 에이전틱 애플리케이션 데이' 행사에서 발표하고 있다. [사진=LG유플러스]

[경제일보] 국내 이동통신사들이 인공지능(AI) 서비스 경쟁력 확보를 위해 인프라 고도화에 속도를 내고 있다. 생성형 AI 서비스 확대와 함께 모델 운영 비용과 인프라 부담이 커지면서 AI 개발부터 서비스 운영까지 전 과정을 통합하려는 움직임이 본격화되는 모습이다.

10일 LG유플러스는 최근 AWS가 주최한 '2026 모던 에이전틱 애플리케이션 데이' 행사에서 AI 모델을 실제 서비스로 안정적으로 운영하기 위한 플랫폼 구축 사례를 공개했다고 밝혔다.

이번 행사는 생성형 AI와 에이전트 기술을 활용한 인프라 운영 자동화를 주제로 진행됐다. LG유플러스는 기존 온프레미스 중심의 AI 개발 환경을 클라우드와 연계한 하이브리드 구조로 전환하고 AI 개발부터 서비스 운영까지 전 과정을 효율적으로 연결한 플랫폼 구축을 진행했다고 설명했다. 이를 통해 AI 서비스 품질과 운영 안정성을 동시에 높일 수 있는 기반을 마련한 것으로 나타났다.

이번 플랫폼은 AI 모델 개발과 서비스 운영 단계 간 단절을 줄이는 데 초점을 맞췄다. 기존에는 AI 모델 학습, 평가, 배포, 운영이 각각 분리돼 진행되면서 서비스 전환 과정에서 반복적인 작업과 시간이 소요된 것으로 알려졌다. 이에 LG유플러스는 하나의 흐름으로 통합해 AI 모델을 보다 빠르게 서비스에 적용할 수 있도록 구조를 설계했다.

LG유플러스는 AI를 한 번 개발하고 끝나는 방식이 아닌, 언제든 서비스에 적용할 수 있는 '모델 준비 상태'를 유지하는 구조를 목표로 플랫폼을 구축했다고 설명했다. 데이터 수집부터 학습, 평가, 배포, 운영까지 전 과정을 하나의 파이프라인으로 연결해 개발자와 운영자가 일관된 환경에서 AI를 활용할 수 있도록 구성했다.

이를 위해 AWS의 관리형 쿠버네티스(컨테이너화된 애플리케이션의 배포, 확장, 관리를 자동으로 처리해주는 플랫폼) 서비스인 '아마존 EKS' 기반의 하이브리드 인프라 아키텍처를 도입했다. 자체 온프레미스 GPU 인프라를 아마존 EKS 클러스터의 하이브리드 노드로 통합하고 클러스터 전체 제어 기능인 쿠버네티스 컨트롤 플레인은 AWS 완전관리형 서비스로 운영하는 구조다. 인프라 운영 부담을 줄이고 서비스 안정성과 품질 개선에 집중할 수 있는 환경을 구축한 것이다.

GPU 자원 활용 방식도 개선했다. 기존에는 GPU를 장비 단위로 고정 할당하는 방식이 일반적이었지만 LG유플러스는 필요에 따라 자원을 유연하게 배분하는 구조를 적용했다. GPU 미사용 시간을 줄여 AI 모델 학습과 서비스 운영에 필요한 자원을 보다 효율적으로 활용할 수 있도록 설계했다.

최근 생성형 AI 서비스가 확대되면서 AI 모델 운영과 인프라 관리 중요성도 커지고 있다. 특히 AI 모델이 실제 서비스에 적용되는 과정에서 운영 안정성과 비용 효율성이 주요 경쟁 요소로 떠오르면서 AI 운영 플랫폼 구축이 통신사 경쟁력 확보의 핵심 요소로 부상하고 있다.

통신사들은 기존 통신 서비스 중심 사업 구조에서 벗어나 AI 기반 서비스 확대를 추진하고 있다. 이에 AI 모델 개발뿐 아니라 서비스 운영과 인프라 관리까지 포함한 통합 플랫폼 구축이 중요한 과제로 떠오르고 있다.

LG유플러스는 이번 플랫폼 구축을 통해 AI 서비스를 보다 빠르게 제공하고, 운영 안정성과 품질 개선을 동시에 추진한다는 계획이다. 특히 데이터 수집부터 모델 개발, 배포, 운영, GPU 자원 관리까지 아우르는 AI 기반 개발 환경을 통해 AI 서비스 경쟁력을 강화한다는 전략이다.

권기덕 LG유플러스 AX엔지니어링Lab장은 "LG유플러스는 AX 서비스 가속화를 위해 데이터 수집부터 모델 개발·배포·운영, GPU 운영까지 아우르는 AI-DLC(AI 주도 개발 라이프사이클) 기반의 엔지니어링 플랫폼 역량을 강화하고 있다"며 "앞으로도 AWS와의 기술 협력을 통해 AI 서비스 품질과 운영 안정성을 지속적으로 높여 나가겠다"고 말했다.
0개의 댓글
0 / 300
댓글을 삭제 하시겠습니까?
닫기
로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?
닫기
기사 이미지 확대 보기
닫기