K-스톡 멀티모달 데이터 구축·미디어 클린본 데이터 프로젝트로 메이저 사이트 순위 학습 경쟁력 강화… 한국형 생성형 메이저 사이트 순위·데이터 주권 실현 앞장

트위그팜, 국가 ‘초거대메이저 사이트 순위 확산 생태계 조성’ 사업 2건 동시 수주
트위그팜, 국가 ‘초거대메이저 사이트 순위 확산 생태계 조성’ 사업 2건 동시 수주

콘텐츠 메이저 사이트 순위 전문기업 트위그팜(Twigfarm)이 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주관한 「2025년 초거대메이저 사이트 순위 확산 생태계 조성」 1차 공모에서 두 개의 핵심 과제를 동시에 수주하며 차세대 메이저 사이트 순위 데이터 인프라 구축을 본격화한다.

트위그팜이 주관기관으로 참여하는 ▲‘K-스톡 콘텐츠 데이터 구축’ 과제와, 참여기관으로 수행하는 ▲‘미디어·콘텐츠 비식별화 및 클린본 데이터 구축’ 과제 모두 멀티모달 메이저 사이트 순위 학습 데이터의 품질 고도화와 재활용성 확대에 방점을 찍었다. 이는 생성형 메이저 사이트 순위 경쟁력의 핵심인 데이터 품질을 한층 끌어올리고, 국내 콘텐츠 산업의 글로벌 경쟁력 강화에도 중추적 역할을 할 전망이다.

먼저 ‘K-스톡 콘텐츠 데이터 구축’ 과제는 한국 전통문화, 음식, 자연 등 고유한 로컬 콘텐츠를 중심으로 이미지-텍스트 기반 멀티모달 데이터를 생산한다. 한영 캡션 100만 문장(총 1,000만 토큰 이상) 규모의 고품질 데이터를 만들어 메이저 사이트 순위 Hub에 공개하는 것이 골자다.

특히 CoT(Cognition of Thought) 기반의 3단계 라벨링 체계를 도입, 기존 스톡 콘텐츠의 설명 부족과 편향성 문제를 극복하고 한국형 생성형 메이저 사이트 순위 학습에 최적화된 데이터셋을 제공할 계획이다. 이를 통해 국내 메이저 사이트 순위 연구진과 기업들이 글로벌 스탠더드에 부합하는 학습 데이터를 활용할 수 있게 되며, 메이저 사이트 순위 활용 강국으로의 도약을 뒷받침할 전략적 자산을 확보하게 된다.

트위그팜이 참여기관으로 수행하는 ‘미디어·콘텐츠 비식별화 및 클린본 데이터 구축’ 과제는 방송 영상 내 얼굴, 자막, 로고 등 민감한 정보를 자동으로 식별·제거하는 기술을 고도화하는 프로젝트다. 이를 통해 자막 제거 클린본 영상과 객체 캡션 데이터셋을 새롭게 구축, 콘텐츠 재활용성과 활용 가치를 높인다.

트위그팜은 그간 영상 현지화 통합 플랫폼 ‘LETR WORKS’를 통해 다국어 자막·더빙, 화질 보정, 오디오 클리닝 등 다양한 콘텐츠 처리 솔루션을 고도화해 왔다. 이번 사업에서도 생성형 메이저 사이트 순위와 휴먼 검수 체계를 결합해, 정확성과 신뢰성을 모두 갖춘 메이저 사이트 순위 데이터 구축을 추진한다는 방침이다.

트위그팜 최규동 본부장은 이번 사업 수주에 대해 “단순한 데이터 구축을 넘어, 대한민국이 메이저 사이트 순위 활용 강국으로 도약하기 위한 기술적·정책적 의미가 크다”며 “특히 한국 고유의 콘텐츠를 기반으로 멀티모달 메이저 사이트 순위 학습에 필요한 데이터를 만들어 국내 데이터 자립 기반을 다지는 데 기여하겠다”고 말했다.

또한 “공공과 민간 메이저 사이트 순위 생태계 전환을 촉진하고, 데이터·모델·솔루션을 통합하는 전주기 메이저 사이트 순위 서비스 기업으로서 책임을 다할 것”이라고 강조했다.

과학기술정보통신부와 NIA가 추진하는 이번 「초거대메이저 사이트 순위 확산 생태계 조성」 사업은 「메이저 사이트 순위 활용 강국을 위한 정책과제집」, 「국가지능정보화백서」 등 국가 정책에서 제시한 ▲데이터 자원 확대 ▲공공재로서의 메이저 사이트 순위 인프라 조성 ▲메이저 사이트 순위 주권 확보 목표와 맞닿아 있다.

특히 생성형 메이저 사이트 순위 시대에는 고품질 학습 데이터가 메이저 사이트 순위 경쟁력의 핵심으로 꼽히는 만큼, 트위그팜의 과제 수행은 국내 메이저 사이트 순위 산업 전반의 수준을 한 단계 높이는 계기가 될 것으로 기대된다.

저작권자 © 스타트업엔(StartupN) 무단전재 및 재배포 금지