[사이언스미디어센터] 전문가 의견 '코드의 1/3, 이미 AI가 작성중 (사이언스)'

(엠바고 해제 발송) AI 산업 분야 성숙도를 평가하는 한 가지 방법

2026. 1. 22.

잘 안 보이실 땐 여기를 눌러주세요.

전문가 의견 26-011 '코드의 3분의 1, 이미 AI가 작성중 (사이언스)'

2026.1.23. **엠바고 23일 04시 해제**

> SMCK 등록 기자에게는 22일 사전 발송한 메일입니다. -> 등록하기

배경
- AI 기반 코딩이 급속도로 확산되고 있지만, 그 확산 속도는 고르지 않다는 주장이 제기됐습니다. 23일 새벽 발표된 사이언스 논문의 내용입니다.
  - 논문 제목: 'Who is using AI to code? Global diffusion and impact of generative AI' (doi: 10.1126/science.adz9311)
  - (엠바고 23일 04시 KST 해제)
- 네덜란드 연구팀은 협업 프로그래밍 플랫폼인 GitHub에서 약 16만 명의 개발자가 작성한 3000만 건 이상의 Python 코드를 분석했습니다.
- 코드 블록이 AI를 이용해 만들어졌는지 확인한 결과, 확산 속도가 매우 빨랐음을 발견했습니다.
- 하지만 국가별 차이가 컸습니다. 미국에서는 AI를 활용한 새로운 코드의 비율은 2022년 5%에서 2025년 초 29%로 증가한 반면, 중국에서는 12%에 그쳤습니다.
- 생산성 향상은 2024년 말까지 3.6% 증가했습니다. 하지만 숙련도별로 사용률과 효과 차이가 컸습니다.
  - AI 사용률은 경험이 부족한 프로그래머들 사이에서 가장 높지만, 생산성 향상 효과는 숙련된 개발자들에게서 크게 나타났고 초보자는 효과가 적었습니다.
- 연구팀은 "AI가 디지털 인프라의 핵심이 되어 생산성을 높이고 혁신을 촉진하고 있지만, 이는 주로 상당한 업무 경험을 가진 사람들에게 유리하게 작용하고 있다"고 진단했습니다.

전문가 의견 요청 내용

- 이런 주장 또는 연구 결과가 나오게 된 배경이나 맥락
- 현재 관점에서 이 연구 결과가 갖는 의미. 특히 한국 사회에 갖는 함의
- 이번 논의 또는 연구 결과가 갖는 독창성(주제, 사유의 전개 방식, 방법론 등).
- 이번 논의 또는 연구 결과가 갖는 한계나 필요한 개선점 또는 후속 조치(결과 해석의 문제, 통계 사용의 적절성, 기존 주장이나 결론과의 작은 차이 등).

기자 여러분은 아래 주의사항을 참고해 활용해주시길 부탁드립니다.

엠바고는 23일 04시 해제됐습니다. 자유롭게 활용 가능합니다.
되도록 원문을 그대로 활용해주시길 부탁드립니다.
SMCK를 꼭 인용할 필요는 없습니다. 만약 인용 출처가 필요한 경우, 아래 형식을 따를 수 있습니다.
- "ㅇㅇㅇ(전문가)는 한국과학기술미디어센터에 ㅁㅁㅁ라고 말했다."

*SMCK 홈페이지 | 📌 이런 메일을 계속 받고 싶으시다면: 전문가 의견 구독(기자 등록)

박한우 영남대 미디어커뮤니케이션학과・디지털융합비즈니스대학원・사이버감성연구소 교수, 영국 옥스포드인터넷연구소 전 방문연구원

*2026.1.22.

한 국가의 AI 산업 분야 성숙도를 평가하기 위해서는 단일 지표가 아니라 복합적인 지표가 필요하다. 대표적으로 데이터 인프라, 컴퓨팅 파워, 프로그래밍 역량, 애플리케이션 생태계, 그리고 AI의 보급률과 실제 활용 능력 등이 그것이다. 예컨대 미국과 중국은 데이터 인프라와 컴퓨팅 파워 측면에서는 앞서 있지만, 일반 국민과 개발자 층의 AI 보급률과 활용 능력은 한국이나 싱가포르에 비해 반드시 월등하다고 보기는 어렵다.

이 연구는 이러한 문제의식에서 출발하여, 국가별 AI 성숙도 중 ‘프로그래밍 영역’에 초점을 맞춘 비교 연구를 시도하였다. 기존의 자가응답식 설문조사는 응답자의 과장, 왜곡, 편향에 취약하며, 실제로 genAI 도입률에 대한 자기보고 결과는 인구통계학적 특성, 경력, 직급, 산업 분야에 따라 크게 달라진다는 한계가 있다. 이로 인해 현재 genAI의 실제 영향력을 정확히 파악하는 데 상당한 불확실성이 존재해 왔다.

이를 극복하기 위해 본 연구는 방법론적 혁신, 즉 빅데이터 기반 접근법을 채택하였다. 연구진은 개발자들이 가장 많이 활용하는 오픈소스 플랫폼인 GitHub에 축적된 디지털 족적을 분석 대상으로 삼아, 3천만 건이 넘는 파이썬 오픈소스 프로젝트의 코드 커밋(commit)을 머신러닝 기법으로 분석하였다. 핵심 질문은 설문조사가 아니라, “개인이 실제로 genAI를 얼마나, 어떻게 사용하고 있는가를 디지털 행태를 통해 직접 측정할 수 있는가”였다.

이를 위해 연구진은 AI의 실질적 개입이 있는 코드를 식별하는 머신러닝 분류기를 설계·구현하였다. 학습 데이터 구축 과정에서, 먼저 인간이 작성한 함수에 대해 하나의 LLM이 해당 함수의 기능을 자연어로 설명하도록 하고, 이어서 또 다른 LLM이 그 설명을 바탕으로 동일한 기능의 코드를 생성하도록 하였다. 두 개의 서로 다른 LLM을 활용함으로써, 인간 코드와 AI 생성 코드 간의 불필요한 상관관계를 줄이면서도 기능적으로 유사한 학습 데이터를 확보할 수 있었다.

연구 결과, genAI 도입은 단순히 프로그래밍 활동량을 증가시키는 데 그치지 않고, 새로운 라이브러리와 라이브러리 조합에 대한 실험을 유의미하게 확대시키는 것으로 나타났다. 이는 genAI가 개발자들이 새로운 프로그래밍 영역으로 더 빠르게 진입하도록 돕고, 기능적으로 더 복합적인 코드를 작성하게 만든다는 것을 의미한다. 이러한 결과는 genAI가 개인의 혁신 역량을 증대시킨다는 기존 연구 결과와도 일치한다.

다만 이 연구에는 한계도 존재한다. 분석 대상 국가는 6개국에 한정되어 있으며, 분석 기간 역시 2016년부터 2024년까지 약 6년으로, 알파고(2016)와 트랜스포머 모델(2018) 이후 AI 기술이 급속히 발전한 맥락을 고려하면 충분히 긴 기간이라고만 보기는 어렵다. 그럼에도 불구하고, 주요 genAI 기술이 공개된 직후 각국에서 AI 생성 코드가 급증하는 패턴이 확인되었다. 미국이 여전히 선두를 유지하고 있으나 격차는 점차 축소되고 있으며, 독일과 프랑스가 뒤를 바짝 추격하고 있고, 인도는 빠르게 따라잡고 있는 반면, 중국과 러시아는 2024년 기준 여전히 뒤처져 있는 것으로 나타났다. 또한 genAI 도입률은 경력이 짧은 개발자층에서 더 높았으나, 성별에 따른 유의미한 차이는 발견되지 않았다.

이 연구는 6개 주요 국가에서 genAI 기반 코딩이 얼마나 빠르게 확산되는지, 그 확산이 개인의 특성과 어떻게 연결되는지, 그리고 실제 프로그래밍 활동에 어떤 영향을 미치는지를 미시적 데이터 수준에서 분석할 수 있음을 보여준다. 나아가, 이러한 방식은 향후 genAI 활용을 실시간에 가깝게 모니터링할 수 있는 가능성도 제시한다. 분석 결과, AI 도입은 빠르게 진행되고 있으나 국가별·개인별로 이질적이며, 동시에 온라인 협업 환경에서 개발 활동의 증가와도 밀접하게 연관되어 있음을 확인하였다.

이 조사 결과가 한국에 주는 가장 중요한 시사점은, AI를 포함한 과학기술 정책 수립과 평가에서 증거 기반 접근의 중요성이다. 현재 한국은 여전히 전문가의 정성적 판단, 자가응답식 설문, 포커스 인터뷰 등에 과도하게 의존하고 있어 정책의 객관성과 정밀성이 충분히 담보되지 못하고 있다. 반면, 디지털 족적에 기반한 증거 중심 정책 설계는 데이터기반행정법의 취지에도 부합한다. 정책의 방향이 특정 집단의 목소리 크기에 의해 결정되는 것이 아니라, 데이터에 나타난 패턴과 변화 속도를 근거로 정책의 내용과 추진 속도가 결정되어야 할 시점이다.

han.woo.park.korea@yu.ac.kr

한국과학기술미디어센터(SMCK) 소개

한국과학기술미디어센터는 근거 기반의 과학 정보를 언론에 제공하는, 과학계와 미디어 사이의 다리 역할을 하는 독립 비영리 조직입니다. 잘못된 정보와 가짜 뉴스가 넘쳐나는 세상에서, 제대로 된 전문가의 해설과 의견을 빠르고 다양하게 기자들에게 제시하고 이를 체계적으로 아카이빙하는 역할을 합니다.

2025년 7월 이사회를 구성하고(이사장 노정혜 전 한국연구재단 이사장) 센터장(이근영 전 한겨레 과학전문기자)을 선임했으며, 같은해 9월 개소식을 열며 활동을 시작했습니다.

*참고 기사:

SMCK 역할

SMCK는 세 분야 전문가인 과학자, 기관 커뮤니케이터(홍보팀), 기자에게 구체적인 도움을 드리고자 설립됐습니다. 각각 아래와 같습니다.

과학자, 연구자에게는 의견과 해설이 온전한 맥락과 함께 제공되는 안전한 발언 공간이 돼줍니다. 선의를 위해 한 논평이 기사화 과정에서 왜곡되거나 부정확하게 변질될 우려를 줄이는 완충 작용을 합니다.
기관 홍보 담당자에게는 기관의 성과를 기자들에게 보다 객관적이고 정교하게 알리고, SMC 글로벌 네트워크를 통해 영향력을 높일 기회를 제공합니다.
기자에게는 사안을 해석하는 데 도움이 될 치우침 없는 종합적인 정보를 빠르고 풍성하게 제공하고, 이를 통해 기사에서 과학과 기술을 보다 자유롭고 편리하게 활용하도록 돕습니다.

SMCK는 이를 통해, 궁극적으로 근거에 기반해 사안을 합리적으로 판단하고 이것이 정책에까지 반영되는 사회를 만드는 데 기여하고자 합니다.

해외 협력

사이언스미디어센터(SMC)는 2002년 영국에서 최초로 설립됐고 현재 호주와 뉴질랜드, 독일, 스페인, 대만 등으로 확장됐습니다. 글로벌 네트워크에 포함된 6개 조직은 엄격한 독립성과 신뢰성이라는 가치를 공유하고 있으며 협력을 통해 주요한 국제 과학 이슈에 공동 대응하고 있습니다.

한국은 신생 조직으로서 글로벌 네트워크와 긴밀히 협력하고 있습니다.