한 국가의 AI 산업 분야 성숙도를 평가하기 위해서는 단일 지표가 아니라 복합적인 지표가 필요하다. 대표적으로 데이터 인프라, 컴퓨팅 파워, 프로그래밍 역량, 애플리케이션 생태계, 그리고 AI의 보급률과 실제 활용 능력 등이 그것이다. 예컨대 미국과 중국은 데이터 인프라와 컴퓨팅 파워 측면에서는 앞서 있지만, 일반 국민과 개발자 층의 AI 보급률과 활용 능력은 한국이나 싱가포르에 비해 반드시 월등하다고 보기는 어렵다.
이 연구는 이러한 문제의식에서 출발하여, 국가별 AI 성숙도 중 ‘프로그래밍 영역’에 초점을 맞춘 비교 연구를 시도하였다. 기존의 자가응답식 설문조사는 응답자의 과장, 왜곡, 편향에 취약하며, 실제로 genAI 도입률에 대한 자기보고 결과는 인구통계학적 특성, 경력, 직급, 산업 분야에 따라 크게 달라진다는 한계가 있다. 이로 인해 현재 genAI의 실제 영향력을 정확히 파악하는 데 상당한 불확실성이 존재해 왔다.
이를 극복하기 위해 본 연구는 방법론적 혁신, 즉 빅데이터 기반 접근법을 채택하였다. 연구진은 개발자들이 가장 많이 활용하는 오픈소스 플랫폼인 GitHub에 축적된 디지털 족적을 분석 대상으로 삼아, 3천만 건이 넘는 파이썬 오픈소스 프로젝트의 코드 커밋(commit)을 머신러닝 기법으로 분석하였다. 핵심 질문은 설문조사가 아니라, “개인이 실제로 genAI를 얼마나, 어떻게 사용하고 있는가를 디지털 행태를 통해 직접 측정할 수 있는가”였다.
이를 위해 연구진은 AI의 실질적 개입이 있는 코드를 식별하는 머신러닝 분류기를 설계·구현하였다. 학습 데이터 구축 과정에서, 먼저 인간이 작성한 함수에 대해 하나의 LLM이 해당 함수의 기능을 자연어로 설명하도록 하고, 이어서 또 다른 LLM이 그 설명을 바탕으로 동일한 기능의 코드를 생성하도록 하였다. 두 개의 서로 다른 LLM을 활용함으로써, 인간 코드와 AI 생성 코드 간의 불필요한 상관관계를 줄이면서도 기능적으로 유사한 학습 데이터를 확보할 수 있었다.
연구 결과, genAI 도입은 단순히 프로그래밍 활동량을 증가시키는 데 그치지 않고, 새로운 라이브러리와 라이브러리 조합에 대한 실험을 유의미하게 확대시키는 것으로 나타났다. 이는 genAI가 개발자들이 새로운 프로그래밍 영역으로 더 빠르게 진입하도록 돕고, 기능적으로 더 복합적인 코드를 작성하게 만든다는 것을 의미한다. 이러한 결과는 genAI가 개인의 혁신 역량을 증대시킨다는 기존 연구 결과와도 일치한다.
다만 이 연구에는 한계도 존재한다. 분석 대상 국가는 6개국에 한정되어 있으며, 분석 기간 역시 2016년부터 2024년까지 약 6년으로, 알파고(2016)와 트랜스포머 모델(2018) 이후 AI 기술이 급속히 발전한 맥락을 고려하면 충분히 긴 기간이라고만 보기는 어렵다. 그럼에도 불구하고, 주요 genAI 기술이 공개된 직후 각국에서 AI 생성 코드가 급증하는 패턴이 확인되었다. 미국이 여전히 선두를 유지하고 있으나 격차는 점차 축소되고 있으며, 독일과 프랑스가 뒤를 바짝 추격하고 있고, 인도는 빠르게 따라잡고 있는 반면, 중국과 러시아는 2024년 기준 여전히 뒤처져 있는 것으로 나타났다. 또한 genAI 도입률은 경력이 짧은 개발자층에서 더 높았으나, 성별에 따른 유의미한 차이는 발견되지 않았다.
이 연구는 6개 주요 국가에서 genAI 기반 코딩이 얼마나 빠르게 확산되는지, 그 확산이 개인의 특성과 어떻게 연결되는지, 그리고 실제 프로그래밍 활동에 어떤 영향을 미치는지를 미시적 데이터 수준에서 분석할 수 있음을 보여준다. 나아가, 이러한 방식은 향후 genAI 활용을 실시간에 가깝게 모니터링할 수 있는 가능성도 제시한다. 분석 결과, AI 도입은 빠르게 진행되고 있으나 국가별·개인별로 이질적이며, 동시에 온라인 협업 환경에서 개발 활동의 증가와도 밀접하게 연관되어 있음을 확인하였다.
이 조사 결과가 한국에 주는 가장 중요한 시사점은, AI를 포함한 과학기술 정책 수립과 평가에서 증거 기반 접근의 중요성이다. 현재 한국은 여전히 전문가의 정성적 판단, 자가응답식 설문, 포커스 인터뷰 등에 과도하게 의존하고 있어 정책의 객관성과 정밀성이 충분히 담보되지 못하고 있다. 반면, 디지털 족적에 기반한 증거 중심 정책 설계는 데이터기반행정법의 취지에도 부합한다. 정책의 방향이 특정 집단의 목소리 크기에 의해 결정되는 것이 아니라, 데이터에 나타난 패턴과 변화 속도를 근거로 정책의 내용과 추진 속도가 결정되어야 할 시점이다.
han.woo.park.korea@yu.ac.kr