.김포개인회생 북한도 GPU를 가져다 놓고 쓴다. 다만 성능은 떨어질 수 있다. 이것을 어떻게 아느냐 하면 김일성종합대학 학보에 ‘GPU를 사용했다’고 밝힌 자료가 실려 있다. 그래서 나는 학보에서 해외 기술·제품이 언급된 대목을 모아 정리하려고 한다. 북한이 해외 오픈소스에서 무엇을 썼는지를 드러내는 데이터가 쌓이면 해외 기술을 어떻게 끌어왔는지도 보일 것이다.” 북한 AI의 핵심은 생성형이 아니라 목적형이라는 말이 나온다. 이유는 뭔가. “생성형 AI는 부담이 크다. 인터넷을 개방하지 않는 나라에서 생성형 AI를 운영하면 돌발 변수를 감당하기 어렵다. 누군가 ‘김정은을 어떻게 생각하냐’고 물었을 때 어떤 답이 나올지 정권 입장에선 통제가 불가능하다. 정책적으로도 주민이 접했을 때 통제에 문제가 생긴다. 기술적으로도 초대형 모델을 운영하려면 인력, 데이터, GPU 기반 데이터센터, 전력에 이르기까지 상당한 규모가 필요하다. 북한은 그러한 기반이 없다. 특히 데이터가 부족하다.” 데이터가 부족한데 AI 학습이 가능한가. “북한이 갈망하는 것 중 하나가 외부 정보다. 해외에 나가는 사람들은 논문 같은 자료를 가져오는 일이 매우 중요하다. 지금은 공개정보(OSINT)가 활발해졌고 장벽 없이 이용이 가능한 오픈사이언스·오픈액세스(OA) 저널이 늘었다. 크롤링(crawling·웹에서 자료를 수집하는 행위)만 해오면 된다. 다만 문헌 데이터뿐 아니라 공장 흐름 데이터, 기상 데이터, 환경·노동 조건 데이터 같은 현장 데이터는 축적 기반이 약하다. 그래서 생성형 AI를 돌리기는 더 어렵다.”