[인터뷰] 임경빈 이코어 대표, “슈퍼컴퓨터가 대규모 AI 구현의 기반 될 것”

어느새 슈퍼컴퓨터는 AI를 개발하고 운영하기 위한 인프라로 자리잡고 있다. 슈퍼컴퓨터의 최신 흐름에 대한 여러 이야기를 이코어의 임경빈 대표에게 들어본다.

과학기술을 위한 강력한 컴퓨팅 성능을 제공하는 슈퍼컴퓨터는 오래 전부터 정부의 주요 기관, 혹은 대규모 연구 단체나 일부 대기업이나 사용할 수 있는 컴퓨팅 인프라였다. 물론 지금도 슈퍼컴퓨터는 일반인들이 사용하기에는 비용측면은 물론이고 번거롭고 힘든 사용 환경으로 인해 낯선 존재에 불과하지만, 그럼에도 슈퍼컴퓨터에 대한 수요는 계속 증가하고 있으며, 바로 AI가 슈퍼컴퓨터의 수요를 견인하고 있는 주요 원인으로 알려져 있다.

그리고 최근 슈퍼컴퓨터의 가장 큰 활용 분야는 바로 AI(Artificial Intelligence)다. 특히 슈퍼컴퓨터에 AI를 위한 GPGPU(General-Purpose computing on Graphic Processor Unit)를 탑재하는 것이 거의 기본이 되고 있다는 점에, AI가 슈퍼컴퓨터 분야에서 보여주는 위력을 알 수 있다.

문제는 성능의 향상을 위해 더 많은 회로를 집적하고, 더 높은 동작 클럭을 사용하기 위해 더 많은 전력을 요구하고 있으며, 이 과정에서 필연적으로 발열 또한 급격하게 증가하고 있다는 것이다. 예를 들면 엔비디아의 최신 B200 AI 칩은 기존의 제품에 비해 2배가 넘는 2080억개의 트랜지스터로 구성돼 있으며, 이를 가동하기 위해 기존 제품에 비해 50% 증가한 1000W의 전력을 소비한다. 그리고 이 과정에서 전력 소비에 걸맞는 발열의 증가 또한 뒤따를 수밖에 없다. AI로 인한 발열을 해결하기 위해 데이터센터 분야에서 이전의 공냉 방식의 한계를 극복하기 위해 공기가 아닌 액체를 이용해 냉각하는 수냉 방식을 도입하고 있는 것도 이런 이유이다.

지난 2015년 설립된 국내 슈퍼컴퓨터 전문 업체 이코어는 이런 급변하는 슈퍼컴퓨팅 분야에서 정부 연구소뿐 아니라 제조, 교육, 바이오, 의료 등 다양한 영역의 고객을 확보해 나가고 있다.

이코어는 크게 HPC와 IBM 사업부 등 2개 사업부에 집중해 비즈니스를 하고 있으며, 특히 IBM 스토리지 분야에서는 국내에서 높은 기술력을 인정받아 AI 스토리지 전문 파트너인 챔피언 클럽으로 선정됐다.

이코어의 임경빈 대표를 만나 AI로 인한 슈퍼컴퓨팅 분야의 변화와 주요 이슈에 대해 들어봤다.

임경빈 | 이코어 대표

최근 슈퍼컴퓨팅과 HPC 분야에서 AI가 점점 더 중요한 위치를 차지하고 있습니다. AI가 슈퍼컴퓨터의 핵심적인 활용분야가 되고 있는 이유는 무엇입니까?

챗GPT의 놀라운 등장이 AI의 패러다임을 크게 바꿔놨습니다. 이전에도 AI를 위한 고속 연산에 슈퍼컴퓨터, 혹은 HPC(High-Performance Computing)를 사용하는 경우가 없었던 것은 아니었습니다. 하지만 생성 AI를 위한 LLM은 학습을 위해 엄청난 규모의 데이터를 빠르게 처리할 수 있어야 합니다. 여기서 대용량의 스토리지, 그리고 이 스토리지에 저장된 엄청난 규모의 데이터를 빠르게 읽어 들이고 처리할 수 있어야 하며, 이를 빠르게 학습하기 위한 GPGPU와 같은 컴퓨팅 자원 등이 갖춰져야 합니다.

다시 말해 대용량의 데이터를 저장하고 빠른 데이터 처리를 위한 고성능 스토리지와 네트워크, 그리고 학습 등의 연산을 위한 고성능 프로세싱 등이 결합된 슈퍼컴퓨터는 대규모 생성 AI를 개발하기 위한 선택이 아닌 필수 요소입니다.

최근에는 일반 기업에서도 LLM(Large Language Model)을 구현하기 위한 전용 HPC를 구성하는 경우도 찾아볼 수 있습니다. 이제 AI 개발과 운영을 위해 슈퍼컴퓨터를 구축하는 것은 자연스러운 흐름이 되고 있습니다.

물론 전통적인 기초 과학과 공학분야에서도 여전히 슈퍼컴퓨터를 이용해 다양한 연구를 진행하고 있습니다. AI가 슈퍼컴퓨터의 가장 큰 활용분야가 된 지금에 이르러서도 이런 기초 과학 분야에서 AI 활용이 위축되고 있지는 않습니다.

일반 서버의 성능이 눈부신 속도로 향상됨에 따라 HPC와 일반 서버의 경계가 예전과는 다르게 많이 모호해지고 있습니다. 이런 상황에서 HPC와 슈퍼컴퓨터만이 갖는 강점은 무엇이라고 생각하십니까?
최신 GPU 보드 한 장이 약 15년 전 슈퍼컴퓨터 한 대보다 더 높은 성능을 보여줍니다. 하지만 양자 컴퓨터처럼 완전히 패러다임을 바꿀만한 기술이 등장하기 전까지는 물리적인 한계를 극복할 수는 없습니다.

예를 들어 단일 시스템에 탑재할 수 있는 CPU의 수, 메모리 용량 등의 한계를 극복하기 위해서는 슈퍼컴퓨터가 필요합니다. 그리고 하이엔드 서버가 로우엔드 슈퍼컴퓨터의 성능을 따라잡고 있는 것은 사실이지만, 슈퍼컴퓨터를 활용하고 있는 측에서도 과거와는 비교할 수 없는 높은 성능을 요구하고 있기 때문에 엄연히 격차는 계속 유지되고 있습니다. 슈퍼컴퓨터의 성능이 높아지고 있는 만큼, 연구자 등 활용하고 있는 측에서는 더 많은 변수와 더 큰 모델, 그리고 해석을 추구하기 때문입니다.

HPC가 빠르게 대중화되고 있습니다. 이에 HPC를 효율적으로 관리하고 활용하기 위한 다양한 방안이 등장하고 있습니다. 예를 들면 클라우드나 HCI와 같은 기술이 HPC에 접목되고 있는 모습을 보이고 있습니다.

대학이나 연구소를 중심으로 시스템을 통합하는 경우가 최근 늘고 있습니다. 하나의 강력한 HPC 인프라를 구축하고 이를 여럿이서 공유해 사용함으로써 중복 투자를 막고 한정된 자본을 효율적으로 사용하려는 것입니다.

대학에서는 주로 인공지능 대학원 등을 중심으로 이런 HPC 도입이 이뤄지고 있는데, 이들은 대부분 클라우드 형태로 서비스를 제공하는 것을 기본으로 하고 있습니다. 특히 최근에는 클라우드의 컨테이너와 쿠버네티스 등의 기술로 사용자들이 마치 내 옆에 워크스테이션을 놓고 사용하듯이 HPC를 사용할 수 있는 환경이 만들어지고 있습니다.

더구나 컨테이너의 강점인 포터빌리티로 인해 운영체제나 하드웨어 환경에 따라 변환하고 컴파일하는 등의 작업 없이 쉽게 사용할 수 있습니다.

그리고 이런 장점에 눈을 뜬 일반 기업들도 슈퍼컴퓨터나 HPC를 프라이빗 클라우드로 구성하는 것이 일반적인 환경이 되고 있습니다.

미래의 컴퓨팅 환경이라고 일컬어지는 퀀텀 컴퓨팅 등 새로운 기술에 대해서는 HPC 측면에서 어떻게 대응해 나가고 계십니까?

아직은 동향을 지켜보는 정도에 불과합니다. 다만 IBM의 골드 파트너로써 긴밀하게 협력하면서 퀀텀 컴퓨팅 분야에서 IBM의 전략을 눈여겨 주시하고 있습니다. 특히 IBM이 퀀텀 컴퓨팅 분야에 상당히 적극적으로 나서고 있으며, 연구 개발에 몰두하고 있기에 수년 내에 상당히 의미 있는 수준의 컴퓨팅 인프라가 등장할 수 있을 것으로 기대하고 있습니다.

IBM이 퀀텀 컴퓨팅 분야에 상당히 큰 기대를 걸고 있으며, 국내외에서 저변 확대에 나서고 있습니다. IBM과 긴밀하게 협업을 하고 있는 이코어 또한 IBM의 전략에 맞춰 퀀텀 컴퓨팅에 기반한 새로운 사업 영역을 찾아 나서고 있는 중입니다.

기후 변화에 대응하기 위해 HPC와 슈퍼컴퓨터 분야에서는 어떤 노력을 하고 있습니까?

AI를 위한 최신 프로세서는 강력한 성능만큼 높은 에너지 소비와 발열을 수반합니다. 성능을 위해 더 많은 전기를 요구하는 것은 우리가 감내해야 할 부분이지만, 발열을 관리하는 데 소모되는 전기는 어떻게 보면 성능과는 큰 관계가 없는 불필요한 부분입니다. 따라서 에너지 소비를 줄이기 위해서는 이런 발열 관리 부분에 집중해야 합니다.

현재 많은 슈퍼컴퓨터들이 수냉방식을 채택하고 있는 이유도 여기에 있습니다. 수냉방식은 냉매 유출 등의 문제가 있는 것으로 알려져 있지만, 일종의 음압을 걸어 호스가 단락될 경우 냉매가 밖으로 유출되는 것이 아니라 호스 안으로 빨려들어가는 방식을 사용하기도 합니다.

이외에도 슈퍼컴퓨터를 운영하기 위한 에너지원으로 태양광 발전이나 풍력 발전 등 친환경 신재생 에너지를 적극적으로 활용해 나가고 있습니다.

또 한편으로는 데이터센터의 설계에서부터 효율성을 높이기 위한 여러가지 방법을 사용하고 있으며, 최신 데이터센터들은 수냉을 위한 밸브를 기본적으로 갖추고 있는 등 수냉방식 도입이 적극적으로 시도되고 있습니다.

어찌됐든 기후변화에 대응하고 운영비용을 절감을 위한 친환경 슈퍼컴퓨터, HPC 기반을 만들기 위해서 이미 업계는 많은 노력을 기울여 왔으며, 앞으로도 이런 노력을 지속해 나갈 것입니다.