언론기사

"차세대 AI 생태계 구축 선도"…트위그팜, 국책 과제 2건 수주

2025-07-14

콘텐츠 AI(인공지능) 기업 트위그팜이 과학기술정보통신부와 한국지능정보사회진흥원(NIA)의 '2025년 초거대AI 확산 생태계 조성' 사업의 1차 공모에서 두 개의 주요 과제를 동시에 수주했다고 14일 밝혔다.

트위그팜이 수행하게 될 과제는 △'K-스톡 콘텐츠 데이터 구축' 과제(주관기관)와 △'미디어·콘텐츠 비식별화 및 클린본 데이터 구축' 과제(참여기관)다. 두 과제 모두 AI 학습용 멀티모달 데이터 구축과 콘텐츠 활용 고도화에 초점을 두고 있다.

K-스톡 콘텐츠 데이터 구축 과제는 한국 전통문화, 음식, 자연 등 고유의 콘텐츠를 중심으로 한 이미지-텍스트 기반 멀티모달 데이터를 구축하고, 한영 캡션 100만 문장(총 1000만 토큰 이상) 이상의 고품질 데이터를 생산해 AI 허브(Hub)에 공개하는 프로젝트다.

AI 허브는 NIA가 운영하는 AI 통합 플랫폼이다. AI 기술·서비스 개발에 필수적인 AI 학습용 데이터, 소프트웨어, 컴퓨팅자원 등을 원스톱으로 제공하는 것을 목적으로 한다.

트위그팜은 CoT(Cognition of Thought, 인간의 추론을 반영한 논리적 추론) 기반의 3단계 라벨링 체계를 도입해 기존 스톡 콘텐츠의 편향성과 설명 부족 문제를 극복하고, 한국형 생성형 AI 학습에 최적화된 콘텐츠를 제공할 계획이다.

아울러 미디어·콘텐츠 비식별화 및 클린본 데이터 구축 과제에선 방송 영상 내 얼굴, 자막, 로고 등의 민감 요소를 자동 식별 및 제거하는 기술을 고도화하고, 자막 제거 클린본 영상 및 객체 캡션 데이터셋을 구축해 콘텐츠의 재활용성과 활용 가치를 극대화하는 데 초점을 둔다.

트위그팜은 자체 개발한 영상 현지화 통합 플랫폼 '레터웍스'(LETR WORKS)를 통해 다국어 자막 및 더빙, 화질 보정, 오디오 클리닝, 클린본 영상 자동화 등 다양한 콘텐츠 처리 기술을 고도화해왔다.

트위그팜 관계자는 "한국 고유의 콘텐츠를 기반으로 멀티모달 AI 학습에 필요한 데이터를 구축하고, 향후 소버린 AI 시대에 대응할 수 있는 국내 데이터 자립 기반을 다지는 데 기여하겠다"고 했다.

←  뉴스 리스트로 가기