보도자료

트위그팜, 멀티모달 K-스톡 데이터 구축으로 초거대 AI 사업 ‘우수’ 등급 달성

2026-02-13

트위그팜 컨소시엄, 「2025년도초거대 AI 확산 생태계 조성사업」 최종평가 ‘우수’ 획득

트위그팜 컨소시엄은 한국지능정보사회진흥원(NIA)이 주관한 「2025년도 초거대 AI 확산 생태계 조성사업」 8번 과제 – ‘K-스톡 콘텐츠 데이터 구축’ 사업에서 최종평가 ‘우수’ 등급을 획득하였습니다.

이번 평가는 데이터 품질, 구축 체계, 기술적 완성도, 활용 가능성 등 전반적인 수행 역량을 종합적으로검증하는 절차로, 트위그팜 컨소시엄은 전 항목에서 높은 평가를 받으며 우수 등급을 달성하였습니다.

■ 과제 개요 – K-스톡콘텐츠 데이터 구축

본 과제는 초거대 AI 시대에 요구되는 고품질·대규모 멀티모달 학습용 데이터를 구축·개방하기 위한 국가 사업입니다.

특히, 한국적 문화·지리·생활 맥락을 반영한 이미지-텍스트 기반의 멀티모달 데이터셋을 구축하여, 글로벌 생성형 AI 환경에서 한국형 데이터 경쟁력을 확보하는 것을목표로 하였습니다.

주요 구축 내용은 다음과 같습니다.

  • 이미지 50,000장 이상 확보 및 정제
  • 한국어·영어 각 50만 문장 이상 캡셔닝 데이터 구축
  • 객체·행동·맥락·의도·문화적 배경을 포함한 고도화된 추론형 메타데이터 설계
  • AI-Hub 공개 기준에 부합하는 데이터 구조 및 품질 체계 수립

본 데이터는 향후 멀티모달 초거대 AI 모델 학습, 영상 검색(Image Retrieval), 문화 기반 생성형 AI 고도화 등에 활용될 예정입니다.

■ 과제의 전략적 의미

본 사업은 단순 데이터 제작을 넘어 다음과 같은 의미를 갖습니다.

  1. 한국형     멀티모달 데이터 경쟁력 확보
        글로벌 AI 시장에서 비영어권 문화 데이터는 상대적으로 부족한 상황입니다. K-스톡 데이터는 한국적 맥락을 반영한 고품질 학습 데이터를 체계적으로 구축함으로써, 한국 문화 기반 AI 서비스의 토대를 마련하였습니다.
  2. 초거대 AI 생태계 확산 기여
        AI-Hub 공개를 통해 연구기관·기업·스타트업이     활용 가능한 국가 단위 데이터 인프라를 구축하였습니다.
  3. 데이터-모델 연계형 설계
        단순 수집이 아닌, 실제 AI 모델     학습 및 유효성 검증까지 고려한 구조적 설계를 적용하여 데이터 활용성을 극대화하였습니다.

■ 트위그팜의 핵심 기술 역량

이번 과제 수행 과정에서 트위그팜은 다음과 같은 기술적 강점을 기반으로 사업을 수행하였습니다.

1. 멀티모달 데이터 설계 역량

  • 이미지-텍스트 통합 구조 설계
  • 추론 기반     캡셔닝 프롬프트 엔지니어링
  • 문화·맥락 정보까지 반영한 고도화 메타데이터 정의

2. 자동화 + 휴먼검수 결합 프로세스

  • 대규모 자동     캡셔닝 시스템 구축
  • 단계별 휴먼     검수 및 1-Cycle 반복 품질 점검 체계 운영
  • 정량·정성 평가 병행

3. 모델 기반 유효성 검증 체계

  • 영상 검색(Image Retrieval) 모델 기반 성능 검증
  • Recall 지표를 활용한 데이터-모델 적합성 검증
  • 데이터 품질을 AI 성능과 연계하여 검증하는 체계 도입

4. 보안 및 관리 체계

  • 체계적인     품질위원회 및 품질관리 조직 운영
  • 데이터 접근·로그 관리 등 보안 체계 강화
  • AI-Hub 공개 기준에 맞춘 산출물 구조화

■ ‘우수’ 평가를받은 주요 요인

최종평가에서 ‘우수’ 등급을획득한 예상되는 요인은 다음과 같습니다.

  • 대규모 데이터     구축의 안정적 수행
  • 체계적인     저작권 확보 및 비식별화 처리
  • 고도화된     캡셔닝 설계 및 추론형 데이터 구조
  • 반복적 품질     검증 프로세스(1-Cycle 기반 자가점검)
  • AI 모델 기반 유효성 검증 수행
  • 데이터 확산     및 활용 전략의 구체성

이는 단순 데이터 납품을 넘어, 설계·구축·검증·활용까지 전과정을 아우르는 통합 역량을 인정받은 결과입니다.

■ 향후 계획

트위그팜은 본 사업을 통해 축적된 멀티모달 데이터 구축 기술과 품질관리 체계를 기반으로,

  • 초거대 AI 학습 데이터 고도화
  • 한국 문화     특화 데이터 확장
  • 산업 수요     기반 AI 데이터 서비스 개발

을 지속적으로 추진해 나갈 계획입니다.

■ 문의

본 사업 및 데이터 구축 관련 문의는 아래 이메일로 연락해주시기 바랍니다.

📩support@twigfarm.net

 

←  뉴스 리스트로 가기