"차원이 다른 AI반도체" 사피온, 엔비디아에 도전장

'추론 특화' X330 공개…전작 대비 연산 4배·전력 효율 2배↑
트랜스포머 기반 LLM 실행 가능…내년 하반기 본격 양산

류수정 대표가 지난 15일 서울 중구 SK T타워에서 열린 출시 발표 기자간담회에서 차세대 AI 추론용 NPU 칩 ‘X330′을 소개하고 있다. /사진=사피온.

[데일리임팩트 변윤재 기자] "우리의 경쟁상대는 (엔비디아의) L40S다."

생성형 인공지능(AI)이 기술 지형을 바꿔놓고 있다. 전 세계 테크기업들은 AI 수요를 흡수하기 위해 경쟁적으로 기술 연구개발과 상용화에 박차를 가하고 있다.

AI 성능을 좌우하는 반도체는 개화 단계다. 현재 그래픽처리장치(GPU) 강자, 엔비디아가 주름잡고 있지만 기술 진전에 따라 상황을 달라질 가능성이 높다. GPU는 이미지 처리에 최적화된 까닭에 AI 추론에서는 다소 미흡한 부분이 있어서다. 게다가 전력 효율과 원가 경쟁력에서도 기업의 부담이 적지 않다. 이런 상황에서 국내 AI반도체기업, 사피온이 엔비디아에 도전장을 냈다. 사피온은 AI 추론에 최적화된 신경망처리장치(NPU)로 고용량 고성능 데이터센터를 집중 공략하겠다는 구상을 밝혔다.

16일 사피온은 기자간담회를 통해 데이터센터용 AI반도체 X330 출시를 알렸다.

사피온은 2022년 SK텔레콤과 SK하이닉스, SK스퀘어 등 SK의 ICT 3사가 800억원을 공동 출자해 설립한 AI(인공지능) 칩 팹리스(반도체 설계)다.

사피온이 이날 공개한 X330은 전작 X220보다 연산 성능은 4배, 전력 효율은 2배 이상 높였다. 초고속·저전력을 구현하는 만큼, 투자 비용 때문에 AI 데이터센터 구축을 고민하는 기업들의 니즈를 반영했다.

류수정 대표는 "X220 4개로 처리했던 연산을 X330 1개로 할 수 있게 된다"면서 "높은 전성비로 데이터센터의 전력 비용과 탄소 저감 문제를 해결할 수 있다"고 강조했다.

X330의 강점은 '편리함'에 있다. 거대언어모델(LLM) 지원을 추가해 전반적인 TCO(총소유비용)을 개선했다. X220이 고성능 AI 언어 모델인 BERT 추론에서 우수했다면, X330은 대화형 AI 챗GPT의 원천기술인 트랜스포머 기반 LLM을 지원한다. 이날 시연을 통해 사피온은 LLM 관련 성능을 보여줬다. X330으로 메타의 LLM 라마2 모델 4개를 한 번에 구동시켰다.

또 동영상 관련 프로그램 처리속도 향상을 위해 비디오코덱과 비디오 후처리 반도체 설계자산(IP)을 내장했다. 이를 통해 4채널 4K 60fps 동영상 입력 처리가 가능하다.

이처럼 전작에 비해 응용범위가 대폭 확대됨에 따라 신제품이 더 다양한 산업군에서 활용할 수 있게 했다. 엔비디아의 고객사들을 끌어들이겠다는 전략이다. 류수영 대표는 "PC, 서버에 바로 적용할 수 있도록 했는데, GPU로 AI 서비스를 하고 있더라도 X330을 탑재해 서비스할 수 있도록 했다"고 설명했다.

사피온은 AI반도체용으로 쓰이는 엔비디아 L40S와 비교해 경쟁력을 갖췄다고 자신하고 있다. 연산능력은 2배, 전력효율은 1.3배 이상 우수하다는 게 회사의 설명이다. X330은 TSMC의 7나노 공정을 채택했다. 엔비디아가 선단공정인 5나노를 채택한 점을 고려하면 발군의 성능이다. 추론에만 집중한 결과다.

추론시장은 실제로도 급속히 성장 중이다. 전 세계 AI 데이터 서버 시장은 연평균 31% 성장하고 있다. 이 중 추론 시장 성장률은 연평균 32%로 학습보다 5%포인트 높다.

엔비디아 GPU 개발을 이끌었던 마이클 쉐바노우 최고기술책임자(CTO)도 새로운 칩의 기술 경쟁력을 자신했다. 그는 "X330은 동급 GPU보다 최대 1.9배의 전력 효율을 구현한다"며 "이는 이산화탄소 감소 지표로도 확인할 수 있다. X330으로 교체할 경우 소나무 1180만 그루를 심는 것과 같은 효과를 기대할 수 있다"고 강조했다.

사피온은 X330을 내세워 AI 서비스 모델 개발기업과 데이터 센터 시장 공락에 적극 나설 계획이다. 이를 위해 서버 장착시 성능을 최적화할 수 있는 개방형 신경망 교환(ONNX) 기반의 소프트웨어 스택을 지원하고, AI 추론 플랫폼 소프트웨어와 소프트웨어 개발 도구(SDK)도 제공하기로 했다. 류 대표는 "생성형 AI 핵심 기술인 LLM 등을 지원하고자 새롭게 개발한 칩이 X330"이라며 "LLM 외 다양한 AI 응용 지원을 계획하고 있다"고 전했다.

특히 비용 효율을 고려하는 기업의 선택권을 담보할 수 있게 X330 라인업은 두 가지로 선보인다. X330 컴팩트와 X330 프라임이다. 두 모델 모두 그래픽 D램은 SK하이닉스의 GDDR6를 채택했는데, 특히 성능이 엔비디아보다 높은 것으로 나타났다. 칩이 하나 쓰인 컴팩트는 367테라플롭스(1초당 1조번의 연산 처리가 가능한 컴퓨터 성능 단위), 칩이 2개 쓰인 프라임은 734테라플롭스를 구현한다.

사피온은 다만 초반 레퍼런스를 SK텔레콤과 협력해 만들 예정이다. 실제로도 사피온은 SK텔레콤의 AI 피라미드 전략에서 인프라를 책임지고 있다.

이와 관련, 사피온은 지난해 12월 SK브로드밴드 가산 인터넷데이터센터(IDC) 내에 사피온 AI 반도체 X220 장착 서버를 사용해 7.6Peta OPS(초당 연산 처리량)에 달하는 대규모 NPU 팜을 구축했다. 이를 통해 실제 데이터센터 환경에서 AI 서비스를 상용화하고 운영 프로젝트를 본격화했다. 기존에도 소규모 서버나 카드로 AI 모델을 연산 처리하는 실증과제는 다수 존재했지만 실제 서비스 상용화를 목표로 대규모 NPU 팜을 구축한 것은 국내 최초다.

사피온은 NPU 팜 프로젝트를 통해 이미지 분석, 자연어 처리, 화질 개선 등 다양한 분야에서의 상용화 테스트를 성공적으로 수행하고 비즈니스 모델 확대 가능성을 확인했다.

이에 따라 주요 고객사를 대상으로 X330 시제품 테스트와 신뢰성 검증 작업을 진행한 뒤 내년 상반기부터 양산을 시작할 예정이다. 아울러 내년에 자율주행차용 AI칩 X340도 선보일 계획이다. X340은 300시리즈 코어의 변형으로 사피온은 IP형태로만 지원한다.

데일리임팩트