나라지식정보, AI 학습용 데이터 구축 성과보고회서 '모빌리티 데이터 업사이클링' 우수사례 발표…자율주행 AI 혁신 이끈다

대표 이미지

 

지난 12월 18일, 서울 코엑스에서 열린 '2025년 AI 학습용 데이터 구축 및 고도화 성과보고회'에서 흥미로운 발표가 있었어요. 과학기술정보통신부 주최, 한국지능정보사회진흥원(NIA) 주관으로 열린 이 자리에서 나라지식정보가 우수사례로 선정되어 '데이터 업사이클링' 모빌리티 분야 사업 성과를 공유했거든요.

'데이터 업사이클링'이라는 표현이 조금 생소하게 느껴질 수 있어요. 쉽게 말하면, 기존에 수집해둔 자율주행 관련 원천 데이터를 버리지 않고 새롭게 재가공해서 최신 AI 연구에 활용할 수 있도록 고품질화하는 작업이에요. 마치 헌 옷을 리폼해서 새 옷으로 만드는 것처럼, 데이터도 업사이클링을 통해 새로운 가치를 얻게 되는 거죠.

나라지식정보 컨소시엄이 이번에 구축한 모빌리티 데이터는 꽤 정교한 과정을 거쳤어요. 대규모 주행 영상 데이터에 텍스트-이미지 관계를 구축하고, 질의응답(QA) 데이터를 추가하고, 데이터 다운사이징 작업까지 진행했어요. 이렇게 만들어진 데이터는 멀티모달 AI 학습에 최적화된 형태로 재탄생했죠.

여기서 잠깐, 멀티모달 AI가 뭔지 간단히 설명드릴게요. 기존 AI가 텍스트만, 또는 이미지만 처리했다면, 멀티모달 AI는 텍스트, 이미지, 음성 등 여러 형태의 정보를 동시에 이해하고 처리할 수 있어요. 자율주행에서는 이런 능력이 특히 중요한데, 도로 위 상황을 눈으로 보고(이미지), 그 상황을 이해하고 판단해야(텍스트/논리) 하니까요.

이번 데이터셋의 활용 가치는 여러 측면에서 주목할 만해요. 우선, 기존의 규칙 기반 알고리즘과는 다른 접근이 가능해졌어요. 거대 언어 모델(LLM)과 멀티모달 기술이 결합된 '엔드투엔드' 자율주행 AI 모델 개발에 바로 활용할 수 있거든요. 엔드투엔드란 입력부터 출력까지 하나의 AI 모델이 통합적으로 처리하는 방식을 말해요.

더불어 교통 법규, 도로 상황에 대한 Q&A 같은 모빌리티 특화 지식도 포함되어 있어요. 그래서 단순한 자율주행 AI를 넘어 '모빌리티AI'라고 부를 수 있는, 교통과 이동 전반을 이해하는 AI 개발의 토대가 될 것으로 기대되고 있어요.

실용적인 측면에서도 큰 의미가 있어요. 다양한 주행 시나리오별 질의응답 데이터와 경량화된 영상 데이터는 가상 환경에서 자율주행 알고리즘을 검증하는 데 활용돼요. 실제 도로에서는 테스트하기 어려운 위험 상황도 가상 환경에서 집중적으로 시험할 수 있게 되는 거죠. 결과적으로 자율주행차 상용화 시기를 앞당기는 데 기여할 전망이에요.

완성된 모빌리티 데이터셋은 AI 허브를 통해 공개될 예정이에요. 자율주행 분야 연구자들과 산업계에서 자유롭게 활용할 수 있게 되는 거죠. 공공 데이터로 공개되는 만큼, 국내 자율주행 기술 발전에 폭넓게 기여할 수 있을 것으로 보여요.

나라지식정보의 손영호 대표는 이번 성과를 바탕으로 앞으로도 업사이클링 사업 참여를 통해 AI 기술 혁신과 다양한 산업 발전에 기여하겠다는 포부를 밝혔어요. 특히 축적된 경험과 자체 AI 기술력을 기반으로 데이터 전처리 솔루션 개발에 집중해 디지털 지식정보화 사업을 확대해 나갈 계획이라고 해요.

사실 나라지식정보는 이 분야에서 꽤 오랜 역사를 가진 기업이에요. 2008년 설립 이후 한국의 언어, 역사, 문화 데이터를 중심으로 국립국어원, 국가기록원, NIA 등 180여 개 기관에서 약 600건의 공공 데이터 및 AI 사업을 수행해왔거든요. '기록이 없으면 역사도 AI도 없다'라는 슬로건처럼, 데이터의 가치를 깊이 이해하고 있는 기업이에요.

기술력도 주목할 만해요. 고문헌이나 비정형 문서도 정확하게 인식하는 AI OCR 엔진, 설명 가능한 AI(XAI)로서의 RAG 기반 LLM, AI Agent 등 자체 개발 기술을 보유하고 있어요. 수작업이 필요한 아날로그 기록물을 AI로 디지털 전환해 지식 콘텐츠로 활용하는 디지털 혁신 서비스를 다양하게 제공하고 있죠.

2024년에는 이노비즈, 벤처기업, 메인비즈, 강소기업, 가족친화기업 인증을 받았고, 장애인 표준사업장 인증을 받은 자회사 한소울지식정보도 설립했어요. 기술 발전과 함께 사회적 역할도 놓치지 않고 있는 셈이에요.

자율주행 기술은 이제 단순히 '스스로 운전하는 차'를 넘어서고 있어요. AI가 도로 상황을 종합적으로 이해하고, 교통 법규를 준수하며, 예상치 못한 상황에도 적절히 대응하는 '지능형 모빌리티'의 시대가 다가오고 있죠. 이번 나라지식정보의 데이터 업사이클링 사업은 그 미래를 앞당기는 작은 발걸음이 될 것 같아요.

데이터가 곧 AI의 연료라는 말이 있어요. 아무리 뛰어난 AI 알고리즘이 있어도 학습할 양질의 데이터가 없으면 제대로 된 성능을 발휘하기 어렵거든요. 그런 점에서 기존 데이터를 재가공해 새로운 가치를 창출하는 '업사이클링' 접근법은 앞으로 더욱 중요해질 거예요. 한정된 자원을 효율적으로 활용하면서도 AI 기술 발전을 이끌어갈 수 있는 지속가능한 방법이니까요.

📎 관련 링크
나라지식정보 공식 홈페이지: http://www.narainformation.com

 


📎 관련 링크

시르바이, 중동 최초 AI 자율 드론 군집 기술 공개…현대 전장의 판도 바꾼다

  중동 최초의 AI 기반 자율 드론 군집 기술이 세상에 공개됐어요. 🚁 아부다비에서 열린 UMEX 2026 행사장, 시르바이(SIRBAI)라는 기업이 방위 산업의 새로운 장을 열었어요. 여러 대의 드론이 마치 한 몸처럼 움직이며 스스로 판단하고 협...