Outlier review

Outlier 오디오 프로젝트 2탄: 야외 녹음 테스크와 갑작스러운 제명 후기

Outlier review

Outlier 오디오 프로젝트 2탄: 야외 녹음 테스크와 갑작스러운 제명 후기

Outlier 오디오 프로젝트 1탄에서 2탄으로

Outlier에서 진행한 첫 번째 오디오 프로젝트는 실내 녹음 어탬터(Attempter) 활동이었다. AI 모델 트레이닝을 위한 한국어 음성 프롬프트 생성이 주된 업무였다. 주어진 쿼리 타입과 토픽에 맞춰 30초 이내의 자연스러운 발화를 녹음하는 방식이었다. 메인 토픽과 서브 토픽의 조화, 그리고 ‘음’, ‘아’와 같은 자연스러운 추임새(Filler words) 활용이 핵심이었다. 1탄을 무사히 마치고 곧바로 프로젝트 2탄인 야외 녹음 테스크에 참여했다.

야외 녹음 테스크와 리뷰어(Reviewer) 활동

2탄은 레벨 1~4 단계의 적절한 소음이 존재하는 야외 공간에서 녹음을 진행해야 했다. 1탄보다 발전한 UI 덕분에 테스크 수행이 훨씬 수월했다. 특히 Outlier의 강점은 한국인 커뮤니티가 활성화되어 있어 PM 및 참가자들과 한국어로 원활하게 소통할 수 있다는 점이었다.

1탄에서의 높은 리뷰 점수 덕분에 2탄에서는 리뷰어(Reviewer) 역할도 병행하게 되었다. 리뷰어는 다른 참가자들이 제출한 과제를 평가하는 포지션이다.

  • 평가 항목: 쿼리 타입 및 토픽 일치 여부, 발화의 자연스러움, 배경 소음 포함 여부
  • 주요 업무: 정해진 루브릭(기준)에 따른 종합 평가 및 한국어 피드백 작성

신규 참가자가 많았던 만큼 리뷰어의 가이드가 프로젝트 퀄리티에 결정적인 영향을 미쳤다.

리뷰어(Reviewer) 활동이 데이터 라벨링 생태계에서 갖는 의미

단순히 데이터를 생성하는 ‘어탬터’를 넘어 ‘리뷰어’로 활동하게 된 것은, 해당 플랫폼이 나의 한국어 이해도와 가이드라인 준수 능력을 신뢰하기 시작했다는 증거이기도 하다.

AI 모델 학습에서 가장 위험한 것은 잘못된 데이터가 입력되는 ‘가비지 인, 가비지 아웃(Garbage In, Garbage Out)’ 현상이다. 야외 녹음 프로젝트처럼 변수가 많은 작업일수록 리뷰어의 역할은 막중해진다. 배경 소음이 가이드라인(레벨 1~4)을 벗어나지는 않았는지, 한국어 특유의 뉘앙스가 프롬프트의 의도와 일치하는지를 꼼꼼히 판별하는 과정은 인공지능이 더 인간답게 소통하도록 만드는 최종 검수 단계이기 때문이다.

이러한 리뷰 업무는 일반 작업보다 집중력을 더 요하지만, 데이터 라벨링 산업의 핵심 메커니즘을 깊이 이해할 수 있는 귀중한 경험이었다.


예고 없는 제명, AI 데이터 라벨링의 명암

순조롭던 활동 중 갑작스럽게 프로젝트에서 제명(Removal) 처리되었다. 이는 비대면으로 진행되는 모든 AI 데이터 라벨링 부업의 고질적인 단점이다. 직접적인 대면 소통이 없기에, 사소한 오해나 소통 부재가 발생하면 별다른 소명 기회 없이 업무가 종료될 수 있다.

내가 추측하는 제명 사유는 ‘오피스 아워(Office Hour)’ 미팅 불참이다. PM이 주최한 미팅 시간에는 접속하지 않은 채, 동시에 채팅방에 질문을 올렸던 것이 화근이 된 듯하다. “미팅도 안 들어오고 질문을 한다”는 인상을 주었을 가능성이 크다.

Outlier 활동 총평 및 교훈

Outlier는 시급이 나쁘지 않고 실시간 소통이 가능해 꽤 괜찮은 수익을 안겨준 플랫폼이었다. 다만 반복되는 작업의 지루함과 소통의 불확실성은 감내해야 할 부분이다. 이번 경험을 통해 비대면 부업은 결코 본업(Main Job)의 영역을 침범해서는 안 된다는 것을 다시 한번 깨달았다.


새로운 시작: Alignerr에서의 연락

제명의 억울함이 가시기도 전에, 수많은 테스트(Assessment)를 거치며 기다렸던 Alignerr에서 연락이 왔다. Outlier에서의 경험을 발판 삼아 새로운 플랫폼에서는 어떤 데이터 라벨링 업무를 수행하게 될지 기대가 된다.

다음 포스팅에서는 Alignerr의 진행 과정과 구체적인 업무 내용을 다룰 예정이다.